期刊文献+

改进的语音特征提取方法及其应用 被引量:8

Improved Speech Feature Extraction and Its Application
下载PDF
导出
摘要 噪音是降低语音识别系统精度的关键因素,因此,如何从带噪语音信号中提取出有效的语音特征是提高语音识别系统识别率的重要途径。该文在分析语音特征提取方法的基础上提出改进算法。实验表明,采用LDA+MLLT+CMS算法组合提取出的语音特征具有较好的鲁棒性,在噪音环境下的平均音节识别率为43.79%。该组合在中文大词汇量连续语音识别系统中也有较好的性能,音节识别率达到83.56%。 Noise is a pivotal factor that reduces recognition rate of a speech recognition system. So how to extract effective speech characteristics becomes an important path for a speech recognition system to increase accuracy. This paper analyses speech feature extraction and makes improvement of it. Experimental results indicate that the algorithm combined with LDA+MLLT+CMS has better robustness than other combinations. Average syllable recognition rate reaches 43.79% by using it under conditions of noises. The algorithm combination has also a good performance in Mandarin Large Vocabulary Continuous Speech Recognition (LVCSR). Syllable recognition accuracy achieves 83.56%.
出处 《计算机工程》 CAS CSCD 北大核心 2008年第5期196-197,200,共3页 Computer Engineering
基金 教育部重点实验室基金资助项目(PAL200508) 辽宁省自然科学基金资助项目(20062033)
关键词 特征提取 主分量分析(PCA) 线性区分分析(LDA) 语音识别 feature extraction Principal Component Analysis(PCA) Linear Discriminant Analysis(LDA) speech recognition
  • 相关文献

参考文献5

  • 1Huang Xuedong, Acero A. Spoken Language Processing: A Guide to Theory, Algorithm and System Development[M]. New Jersey: Prentice-Hall, 2001.
  • 2Nordholm S, Slow Yong Low. Speech Signal Extraction Utilizing PCA-ICA Algorithm with a Non-uniform Spacing Microphone Array[C]//Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing. Toulouse, France: [s. n.], 2006: 965.
  • 3Tsuneo N. Feature Extraction for Speech Recognition Based on Ohogonal Acoustic-feature Panes and LDA[C]//Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing. Phoenix, AZ, USA: [s. n.], 1999: 421-424.
  • 4刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量:50
  • 5Aubert X L. An Overview of Decoding Techniques for Large Vocabulary Continuous Speech Recognition[J]. Computer Speech and Language, 2002, 16(1): 89-114.

二级参考文献14

  • 1俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量:34
  • 2张建平.大词汇量自然连续语音识别中的语言模型和理解算法研究.博士论文[M].北京:清华大学,1999..
  • 3徐波.汉语非特定人听写机系统研究和集成.博士论文[M].北京:中国科学院自动化研究所,1997..
  • 4张建平,博士学位论文,1999年
  • 5Liu J,Chin J Electron,1998年,7卷,2期,135页
  • 6Zheng R,Chin J Electron,1998年,7卷,2期,122页
  • 7Juang B H,IEEE Signal Processing Magazine,1998年,24页
  • 8智能机研究动态,1998年,4期
  • 9计算机世界,1998年
  • 10Lee L S,IEEE Signal Processing Magazine,1997年,63页

共引文献49

同被引文献54

  • 1章熙春,曹燕,张军,韦岗.基于WDFT的语音PLP特征提取算法[J].模式识别与人工智能,2005,18(4):469-473. 被引量:4
  • 2韩疆,刘晓星,颜永红,张鹏远.一种任务域无关的语音关键词检测系统[J].通信学报,2006,27(2):137-141. 被引量:2
  • 3林波,吕明.基于DTW改进算法的孤立词识别系统的仿真与分析[J].信息技术,2006,30(4):56-59. 被引量:12
  • 4RabinerL JuangBH.Fundamentals of speech recognition[M].北京:清华大学出版社,1999.200-240.
  • 5Wang Zuoying, Gao Hongge. An Inhomogeneous HMM Speech Recognition Algorithm[J]. Chinese Journal of Electronics, 1998, 7(1): 73-77.
  • 6哈力克尼亚孜.基础维吾尔语[M].乌鲁木齐:新疆大学出版社,1997.
  • 7WANG Zuo-ying, GAO Hong-ge. An Inhomogeneous HMM Speech Recognition Algorithm [J]. Chinese Journal of Electr- onics, January, 1998,7( 1 ):73-77.
  • 8]哈力克·尼亚孜.基础维吾尔语[M].新疆:新疆大学出版社,1997:69-214.
  • 9那斯尔江.吐尔逊,吾守尔.斯拉木.麦麦提艾力.维吾尔语.大词汇量连续语音识别研究-语音语料库的建立[C].北京:第十一届全国民族语言文字信息学术研讨会论文集,2007,2:379-385.
  • 10梁家恩.语音识别中置信度研究与应用.博士学位论文.北京:中科院自动化所,2007.

引证文献8

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部