基于AMR编码参数的语音识别被引量：1

Speech Recognition Based on AMR Vocoder Parameters

下载PDF

导出

摘要基于语音编码系统的语音识别 ,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数 ,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率 ,并研究了编码参数对识别准确率的影响。在此基础上 ,通过选择受编码影响较小的编码参数 ,直接将 LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明 ,采用这种方法的 AMR语音识别系统 ,其识别效果接近于基于原始语音的识别效果。 Speech coding affects speech recognition performance by deteriorating recognition accuracy as the coded bit rate decreases. The conventional systems that recognize coded speech reconstruct the speech waveform from the coded parameters and then perform recognition based on the characteristic parameters of the waveform. In this paper, a comparison is made between the recognition accuracy of coded speech and the accuracy obtained when using the features derived from the coding parameters. The effects of coding on the recognition accuracy is analyzed. The cepstral streams representing the LPC parameters are combined with residual parameters to recognize directly from the coded parameters. Experiment results suggest that it is possible to obtain recognition accuracy equal to the conventional systems from reconstructed waveforms.

作者杨吉斌曹铁勇张雄伟

机构地区解放军理工大学通信工程学院

出处《解放军理工大学学报（自然科学版）》 EI 2002年第5期6-9,共4页 Journal of PLA University of Science and Technology(Natural Science Edition)

关键词编码参数 AMR声码器语音识别 MEL频率倒谱系数语音编码系统编码速度 AMR vocoder speech recognition MFCC (Mel Frequency Cepstral Coefficients)

分类号 TN912.34 [电子电信—通信与信息系统] TN9 [电子电信—信息与通信工程]

引文网络
相关文献

参考文献6

1Haeb-Umback R. Robust speech recognition for wireless networks and mobile telephony [A]. In: Proc Eurospeech, 97'[C]. Rhodes, Greece, 1997.
2MOKBEL C, MAUUARY L, JOUVET D, etc. Towards improving ASR robustness for PSN & GSMtelephone applications [A]. In: 2^nd IEEE Workshop on Interactive Voice Technology for telecommunications applications (IVTTA1994) [C]. Greece,1996.
33G TS 26. 090-99. AMR speech codec; transcoding functions [S].
4KONDOZ A M. Digital speech-coding for low bit rate communication systems [M]. Singapore: John Wiley sons, 1995.
5ATAL B S. Effectiveness of linear prediction characteristics of the speech wave[J]. J Acoust Soc Am 1974,55(6):1 304-1312.
6RABINER L, JUANG B H. Fundamentals of speechrecognition [M]. Englewood Cliffs: Prentice Hall,1993.

同被引文献9

1阳洪,佘军红,卢先富,彭日红.2型糖尿病及相关因素对老年患者听觉事件相关电位P300的影响[J].内科,2008,3(1):19-21. 被引量：2
2胡景胜,张梅奎.社区糖尿病远程健康服务平台的构想[J].中国数字医学,2012,7(3):115-117. 被引量：2
3林蔚,张继武.糖尿病性视网膜病变的图像处理研究[J].中国数字医学,2012,7(5):68-71. 被引量：2
4孙伟,姚兴祺,刘晓云,周晓,李哲.临床脑电图多媒体教学模式的探讨[J].中国数字医学,2013,8(7):93-94. 被引量：9
5杜宇峰,张连海.AMR语音编码码流特征分析及识别[J].无线电工程,2013,43(8):54-57. 被引量：1
6王元元.语音识别技术在电子病历系统中的应用探索[J].中国数字医学,2013,8(9):105-106. 被引量：7
7李晴辉.健康风险评估系统的实现与应用[J].中国数字医学,2013,8(11):25-27. 被引量：5
8张馨予.移动通信系统中的AMR语音编码[J].科技传播,2010,2(13):183-184. 被引量：1
9王巍,李永禄.语音编码技术的分类、应用和发展[J].无线电通信技术,2003,29(4):38-40. 被引量：4

引证文献1

1马计,杭波,范久波,高凌.基于语音技术的听觉认知功能评测方法研究与实现[J].中国数字医学,2014,9(5):75-77. 被引量：1

二级引证文献1

1艾文伟,胡湲,陈悦勤,李喆,滕靖.智能语音技术在城市轨道交通客运服务中的应用[J].城市轨道交通研究,2021,24(3):152-157. 被引量：6

1毕常青,徐子兴,谢锦辉.基于TMS302C25的语音编码系统[J].计算机应用研究,1995,12(2):27-28.
2张继东,杨震,李晓飞.ITU-T G.729 CS-ACELP语音编码系统的性能分析[J].南京邮电学院学报,2000,20(4):91-94. 被引量：6
3毕卫红,寻智峰,王凯.ITU G.729CS_ACELP语音编码系统[J].现代电子技术,2002,25(12):85-87.
4韩剑坡,王林斗,郝晓鹏,张书军,海春辉.基于DSP的ACELP语音编码系统[J].电子测量技术,2007,30(1):147-149.
5胡斌,何其超.语音LPC参数的自适应LMS实时估计算法[J].声学学报,1992,17(1):65-70. 被引量：1
6朱文育,郭莉,王炳锡.一种适用于低速率语音编码系统的基音周期量化算法[J].信号处理,2005,21(3):271-274.
7孔庆峰,邱玲,朱近康.WCDMA中AMR声码界的编码速率选择[J].无线电工程,2003,33(6):6-9.
8易见兵,胡财桥.基于DSP的G.729语音编码研究[J].科技广场,2008(1):49-51.
9杨震,毕厚杰.神经网络非线性预测及语音编码[J].电子学报,1998,26(1):1-5. 被引量：2
10孔庆峰,李明,邱玲,朱近康.第三代移动通信中AMR声码器的性能分析[J].现代电信科技,2002(10):18-21.

解放军理工大学学报（自然科学版）

2002年第5期

浏览历史

内容加载中请稍等...

基于AMR编码参数的语音识别被引量：1

参考文献6

同被引文献9

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于AMR编码参数的语音识别 被引量：1

参考文献6

同被引文献9

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于AMR编码参数的语音识别被引量：1