摘要
本文通过对Dynamic Time Warp(DTW)和Hidden Markov Model(HMM)存在问题的简要分析,提出了一种基于Mel Frequency Cepstrum Coefficient(MFCC)序列整齐度规则的英语数字识别模型。这种模型完整地表现了语音倒谱系数的时间演化特性,突出了这种特征的细节信息,降低了模型对语音背景环境的依赖程度。实验结果显示,改进后的模型的同源和非同源数字语音的错识率分别降低了45%和69%。实验数据说明,数字语音信息的不完整、以及部分音素相同是造成误判的主要原因。
出处
《电信技术研究》
2005年第5期1-9,共9页
Research on telecommunication technology