期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于分段动态时间规整和后验特征的中文语音模式发现 被引量:2
1
作者 杨鹏 谢磊 陈虹洁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期903-907,共5页
语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral co... 语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。 展开更多
关键词 语音模式发现 后验特征 动态时间规整 分段动态时间规整
原文传递
基于语音识别与特征的无监督语音模式提取 被引量:4
2
作者 张震 赵庆卫 颜永红 《计算机工程》 CAS CSCD 2014年第5期262-265,共4页
在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配... 在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。 展开更多
关键词 语音识别 语音模式发现 分段动态时间弯曲算法 图聚类算法 音素回环后验概率计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部