自适应帧长特征提取对语音识别系统性能的影响

The Influence of Adaptive Frame-length Feature to Speech Recognition Performance

下载PDF

导出

摘要提出一种自适应帧长语音特征分析方法，使语音编码更准确，达到提高语音识别性能的目的。该方法包括过渡帧检测和过渡语音帧特征表示两方面。采用了两种特征表示方法。基于ＴＩＭＩＴ语音数据包和自定义的汉语语音数据的单词识别实验表明，这两种表示方法有相同的效果，都能在一定程度上提高识别系统的性能，但计算量稍有区别。基于ＴＩＭＩＴ数据的ＤＨＭＭ系统和ＣＨＭＭ系统的错识率分别下降了１１．２１％和９．５８％；基于自定义数据的ＤＨＭＭ系统和ＣＨＭＭ系统的错识率分别下降了１１．５５％９．５％。 in this paper, a speech analysis approach with adaptive frame length is proposed to solve the shortcoming of fixed frame length speech analysis, which could not provide optimal coding for every events of speech. Transient signal is detected upon spectral and temporal characteristics of speech. Two expression schedules are used to represent the feature of a transient frame. Word recognition experiments on both TIMIT and NTIMIT databases showed that the proposed speech analysis could significantly improve recognition performance, but the extla computation cost is very little. On TIMIT database, word classification with DHMM (CHMM) demonstrated a 11.21% and 9.58% error rate reduction compared with fixed frame length. and comparable results are achieved for NTIMIT database.

作者贺前华陆以勤韦岗

机构地区华南理工大学电子与通讯工程系

出处《计算机工程》 CAS CSCD 北大核心 2000年第1期82-83,F003,共3页 Computer Engineering

基金国家自然科学基金!69881001 博士点专项基金

关键词自适应帧长语音识别隐马尔可夫模型 Adaptive frame-length Speech recognition Hidden Markov models

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1杨浩荣,王作英,陆大紟.语音识别HMM中引入帧间相关信息的一种参数化模型[J].电子学报,1998,26(10):50-54. 被引量：3
2贺前华，计算机工程，1996年，22卷，6期，471页

二级参考文献3

1战普明,王作英,陆大.语音识别隐马尔可夫模型的改进[J].电子学报,1994,22(1):9-15. 被引量：9
2戴加宁，第二届中国计算机智能接口与智能应用学术会议论文集，1995年，89页
3王作英，第二届全国汉字语音识别会议，1989年

共引文献2

1贺前华,韦岗,金连文.基于遗传算法的HMM最小错识率训练方法[J].电路与系统学报,1999,4(4):46-50. 被引量：2
2贺前华,陆以勤,韦岗.一种新的HMM训练方法[J].电子学报,2000,28(9):56-58. 被引量：2

1毕明雪,潘成胜,田野.自适应帧长高级在轨系统帧同步方案仿真研究[J].信息与控制,2012,41(4):446-453. 被引量：1
2毕明雪,潘成胜,赵运弢,刘庆利.AOS自适应帧长传输系统的仿真研究[J].系统仿真学报,2011,23(2):358-362. 被引量：7
3毕明雪.AOS自适应帧长传输算法研究[J].航空学报,2012,33(11):2039-2047. 被引量：3
4程志蓉.VOIP技术及应用[J].河南科技,2004,23(8):26-26.
5葛跃田.自适应调制编码技术及其在移动通信中的应用[J].现代电子技术,2004,27(2):34-36. 被引量：6
6薛德志,赵新胜.一种联合AMC和自适应帧长技术的ARQ方案[J].军事通信技术,2005,26(S1):28-31.
7王德民.VOIP与数字化校园建设[J].高科技与产业化,2008,14(7):78-78.
8涂俊辉,续晋华.基于HTK的连续语音识别系统及其在TIMIT上的实验[J].现代计算机,2009,15(11):29-33. 被引量：6
9邱卫东,谌勇辉,卢德良,彭澄廉.基于μClinux的IP电话[J].电子产品世界,2005,12(07A):101-103.
10樊桂花,唐斌.基于小波变换的语音基音周期鲁棒性检测[J].信号处理,2004,20(4):365-368. 被引量：8

计算机工程

2000年第1期

浏览历史

内容加载中请稍等...

自适应帧长特征提取对语音识别系统性能的影响

参考文献2

二级参考文献3

共引文献2

相关作者

相关机构

相关主题

浏览历史