一种对加性噪声和信道函数联合补偿的模型估计方法被引量：5

An algorithm of Model Compensation based on the estimation of additive noise and channel function for speech recognition

原文传递

导出

摘要语音识别系统在面对实际环境中多变的加性噪声和信道差异的影响时性能急剧下降,抑制这些噪声和差异所造成的性能下降具有重要意义。作者提出了一种模型补偿算法,使用句子中的非语音段估计加性噪声,然后利用EM算法估计信道函数,从而在倒谱域上对失配的声学模型进行联合补偿。实验表明,相比基线系统,采用该算法的系统的平均性能相对提升幅度超过50%。算法可以动态跟踪环境的变化,性能表现优于一些传统的语音识别稳健性处理算法。 Speech recognition systems declined roughly in performance when they were facing the impacts of various additive noise and channel distortions in the actual environment, so it was of great significance for the speech recognition system to alleviate these impacts of the noise and distortions. An algorithm of model compensation was proposed, which computed the additive noise from the non-speech segments of the sentence, estimated the channel function using the EM algorithm, and jointly compensated the mismatched acoustics HMM models in the cepstral domain with them. Experiments employing this algorithm showed the significant improvement more than 50 percent relatively. The algorithm tracked the changes in the environment dynamically and it provided better performance than the traditional robust speech recognition algorithms.

作者王智国吴及戴礼荣王仁华

机构地区中国科学技术大学清华大学

出处《声学学报》 EI CSCD 北大核心 2008年第3期238-243,共6页 Acta Acustica

关键词补偿算法加性噪声估计方法声学模型信道函数语音识别系统 EM算法

分类号 O422 [理学—声学]

引文网络
相关文献

参考文献16

1Y.Gong. Speech recognition in noisy environments: A survery. Speech Commun., 1995; 16(3): 261- 291.
2Chia-Ping Chen, Jeff Bilmes, and Katrin Kirchhoff. Low- resource noise-robust feature post processing on aurora 2.0. In: Proceedings of International Conference on Spoken Language Processing (ICSLP), 2002:2445 -2448.
3Lim J S, Oppenheim A V. Enhancement and bandwidth compression of noisy speech. Proceedings IEEE, 1979; 67: 1586-1604.
4Ephraim Y. Statistical-Model-Based Speech Enhancement Systems. In: Proc. IEEE, 1992; 80(10): 1526- 1555.
5蒋文建,韦岗.基于掩蔽特性的噪声环境下语音识别新特征[J].声学学报,2001,26(6):516-520. 被引量：10
6陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
7Koehler J, Morgan N, Hermansky H, Gunter-Hirsh H, Tong G. Integrating RASTA-PLP into speech recognition. In: Proceedings ICASSP, 1994; 1:421-424.
8Gales M J F. Model-based techniques for noise robust speech recognition. Ph.D. dissertation, Cambridge Univ., Cambridge, U.K., 1995.
9Liu F, Moreno P J, Stern R M, Acero A. Signal processing for robust speech recognition. In: Proceedings ARPA Workshop on Human Language Technology, 1994: 309- 314.
10Gales M, Young S. A fast and flexible implementation of parallel model combination. In: Proc. IGASSP'95, 1995; 1:133-136.

二级参考文献41

1Xu Jinfu，Electron Lett，2000年，36卷，14期，1247页
2Bu L，IEEE Trans SAP，2000年，8卷，2期，105页
3沈--，电声技术，1997年，10卷，2页
4Pan Davis，IEEE Trans Multi Media，1995年，2卷，2期，60页
5Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error log-spectral amplitude estimator.IEEE Trans Acoust Speech Signal Processing. 1985； 33(2):443-445.
6Lockwood P, Boudy J. Experiments with a nonlinear spectral subtractor (NSS), hidden Markov models and projection,for robust recognition in cars. Speech Commun, 1992；11(6): 21,5-228.
7Tsoukalas D E, Mourjopoulos J N, Kokkinakis G. Speech enhancement based on audible noise suppression.IEEE Transactions on SPEECH and Processing. 1997； 5(6):497-514.
8Seok J W,Bae K S.Speech enhancement with reduction of noise components in the wavelet domain.Copyright 1997 IEEE:1323—1326.
9Johnston J D.Transform coding of audio signal using perceptual noise criteria.IEEE J.Select Areas Commun,1983；6(2):314—323.
10Evangelista G,Cavaliere S.Discrete frequency warped wavelets:theory and applications.IEEE Trans.on Signal Processing,1998；46(4):874—885.

共引文献57

1蒋伟康,张伟.基于掩蔽特性的噪声品质评估研究[J].声学学报,2005,30(2):184-188. 被引量：3
2陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
3章熙春,曹燕,张军,韦岗.基于WDFT的语音PLP特征提取算法[J].模式识别与人工智能,2005,18(4):469-473. 被引量：4
4吴艳红,李文瑞,陈婧,王纯,屈宏伟,吴玺宏,李量.主观空间分离下的汉语信息掩蔽效应[J].声学学报,2005,30(5):462-467. 被引量：6
5冯涛,韩纪庆.基于听觉特性的音频水印能量估计及自适应嵌入算法研究[J].声学学报,2006,31(1):48-54. 被引量：13
6姜占才,袁海良.基于时域与小波域相结合的语音增强技术[J].青海师范大学学报（自然科学版）,2006,22(3):20-22.
7汤玲,戴斌.抗噪声语音识别及语音增强算法的应用[J].计算机仿真,2006,23(9):80-82. 被引量：4
8施晓敏,顾济华,陶智,赵鹤鸣,张晓俊.基于听觉感知小波变换的电子耳蜗CIS语音信号处理[J].微电子学与计算机,2006,23(12):41-43. 被引量：3
9吴红卫,吴镇扬,赵力.基于多窗谱的心理声学语音增强[J].声学学报,2007,32(3):275-281. 被引量：12
10张晓俊,陶智,顾济华,赵鹤鸣,施晓敏.基于听觉感知和概率神经网络的语音识别模型[J].计算机工程与应用,2007,43(19):30-31.

同被引文献61

1刘海滨,吴镇扬,赵力,曾毓敏.噪声环境下基于最大后验非线性变换的隐马尔可夫模型自适应算法[J].声学学报,2004,29(5):467-471. 被引量：4
2孙暐,吴镇扬,刘海滨.非线性统计匹配用于子带鲁棒语音识别[J].电子与信息学报,2006,28(3):480-484. 被引量：4
3陈锴,卢晶,徐柏龄.基于话者状态检测的自适应语音分离方法的研究[J].声学学报,2006,31(3):211-216. 被引量：3
4赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
5王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
6GUO Yanmeng FU Qiang YAN Yonghong.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48. 被引量：5
7徐舜,陈绍荣,刘郁林.基于非线性时频掩蔽的语音盲分离方法[J].声学学报,2007,32(4):375-381. 被引量：9
8Kim W, Hansen J H L. Feature compensation in the cepstral domain employing model combination. Speech Com- munication, 2009; 51(2): 83-96.
9Cui X, Alwan A. Noise robust speech recognition using feature compensation based on polynomial regression of utterance SNR. IEEE Trans. on Speech and Audio Processing, 2005; 13(6): 1161-1172.
10Gauvain J L, Lee C H. Maximum a posteriori estimation for multivariate Gaussian mixture observations of Markov chains. IEEE Trans. on Speech and Audio Processing, 1994; 2(2): 291-298.

引证文献5

1吕勇,吴镇扬.基于最大似然多项式回归的鲁棒语音识别[J].声学学报,2010,35(1):88-96. 被引量：3
2吕钊,吴小培,张超,李密.卷积噪声环境下语音信号鲁棒特征提取[J].声学学报,2010,35(4):465-470. 被引量：3
3吴海洋,杨飞然,周琳,吴镇扬.矢量泰勒级数特征补偿的说话人识别[J].声学学报,2013,38(1):105-112. 被引量：6
4侯雷静,郭婷婷,孙燕,齐英杰,应冬文,唐闽,颜永红.面向心音分割的个性化高斯混合建模方法[J].声学学报,2019,44(1):20-27. 被引量：7
5黄亚琳,董效杰,张远念,郑灏.基于STM32的语音呼救器[J].中小企业管理与科技,2018,2(16):123-124.

二级引证文献19

1黄永明,章国宝,李雄,达飞鹏.全局特征及弱尺度融合策略的小样本语音情感识别[J].声学学报,2012,37(3):330-338. 被引量：9
2吴海洋,杨飞然,周琳,吴镇扬.矢量泰勒级数特征补偿的说话人识别[J].声学学报,2013,38(1):105-112. 被引量：6
3杨勇,李劲松,孙明伟.基于REMOS的远距离语音识别模型补偿方法[J].重庆邮电大学学报（自然科学版）,2014,26(1):117-123. 被引量：3
4何勇军,付茂国,孙广路.语音特征增强方法综述[J].哈尔滨理工大学学报,2014,19(2):19-25. 被引量：3
5侯雷静,郭婷婷,孙燕,齐英杰,应冬文,唐闽,颜永红.面向心音分割的个性化高斯混合建模方法[J].声学学报,2019,44(1):20-27. 被引量：7
6冉国敬,夏秀渝,张凤仪.信道失配环境下鲁棒说话人识别[J].计算机系统应用,2015,24(3):235-240. 被引量：2
7王现彬,杨洁,贾英茜,饶立婵.基于MATLAB的说话人识别系统设计与实现[J].石家庄学院学报,2016,18(3):5-8.
8梁雍,陈克安,张冰瑞.利用冲击声辨识声源材料的特征提取[J].声学学报,2016,41(4):521-528. 被引量：2
9酆勇,熊庆宇,石为人,曹俊华.深度非线性度量学习在说话人确认中的应用[J].声学学报,2018,43(1):112-120. 被引量：3
10谢景一,霍玉倩.新型智能清洁器的设计与改进[J].电子测试,2018,29(11):27-29. 被引量：3

1赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
2董秀洁,王莉,王素菊.一种改进的LS信道估计算法[J].哈尔滨理工大学学报,2009,14(1):47-50. 被引量：6
3李炜,祝唯微,陈宝靖,杨仕博,廖伟,高冠军.CO-OFDM系统中相位噪声和频偏的联合补偿[J].光通信研究,2015(4):4-6. 被引量：1
4陈志江,刘逢清.OBP与DBP联合补偿的112Gb/s DP-16QAM信号传输性能分析[J].光通信技术,2017,41(4):16-19.
5唐汉青,程传炳.小型语音识别系统[J].电力系统通信,1989(2):1-4.
6盛文,徐晨曦,杨江平.纹理分析窗大小的高斯-马尔可夫随机场模型估计方法[J].红外与激光工程,2000,29(6):51-54. 被引量：4
7吕钊,张贝贝,张超.基于时频ICA的PMC模型卷积噪声估计方法研究[J].安徽大学学报（自然科学版）,2016,40(5):24-31.
8王知嘉,刘峰,鲍卫兵.自适应选择联合补偿预测模式的立体视频编码算法[J].China Communications,2009,6(2):58-62.
9段克清,谢文冲,王永良.共形阵机载雷达杂波非平稳特性及抑制方法研究[J].中国科学：信息科学,2011,41(12):1507-1516. 被引量：6
10池新生,郑宝玉,姚刚,陈建白.非对称协作分集通信中网络编码的应用[J].电子与信息学报,2012,34(10):2314-2319. 被引量：5

声学学报

2008年第3期

浏览历史

内容加载中请稍等...

一种对加性噪声和信道函数联合补偿的模型估计方法被引量：5

参考文献16

二级参考文献41

共引文献57

同被引文献61

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种对加性噪声和信道函数联合补偿的模型估计方法 被引量：5

参考文献16

二级参考文献41

共引文献57

同被引文献61

引证文献5

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

一种对加性噪声和信道函数联合补偿的模型估计方法被引量：5