期刊文献+

自适应帧长特征提取对语音识别系统性能的影响

The Influence of Adaptive Frame-length Feature to Speech Recognition Performance
下载PDF
导出
摘要 提出一种自适应帧长语音特征分析方法,使语音编码更准确,达到提高语音识别性能的目的。该方法包括过渡帧检测和过渡语音帧特征表示两方面。采用了两种特征表示方法。基于TIMIT语音数据包和自定义的汉语语音数据的单词识别实验表明,这两种表示方法有相同的效果,都能在一定程度上提高识别系统的性能,但计算量稍有区别。基于TIMIT数据的DHMM系统和CHMM系统的错识率分别下降了11.21%和9.58%;基于自定义数据的DHMM系统和CHMM系统的错识率分别下降了11.55%9.5%。 in this paper, a speech analysis approach with adaptive frame length is proposed to solve the shortcoming of fixed frame length speech analysis, which could not provide optimal coding for every events of speech. Transient signal is detected upon spectral and temporal characteristics of speech. Two expression schedules are used to represent the feature of a transient frame. Word recognition experiments on both TIMIT and NTIMIT databases showed that the proposed speech analysis could significantly improve recognition performance, but the extla computation cost is very little. On TIMIT database, word classification with DHMM (CHMM) demonstrated a 11.21% and 9.58% error rate reduction compared with fixed frame length. and comparable results are achieved for NTIMIT database.
出处 《计算机工程》 CAS CSCD 北大核心 2000年第1期82-83,F003,共3页 Computer Engineering
基金 国家自然科学基金!69881001 博士点专项基金
关键词 自适应帧长 语音识别 隐马尔可夫模型 Adaptive frame-length Speech recognition Hidden Markov models
  • 相关文献

参考文献2

二级参考文献3

共引文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部