基于听觉场景分析的近讲语音增强算法被引量：1

Close-talk speech enhancement algorithm based on CASA

导出

摘要针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音造成的损伤较小。实验表明:该算法能将8～33dB的白噪声、音乐噪声、广播噪声3种噪声类型的带噪语音的信噪比提高到36dB以上,同时保持较高的目标语音可懂度。对于冲击噪声的带噪语音也具有较好的降噪效果。 A two-microphone speech enhancement algorithm was developed for close-talk applications.The algorithm segregates the target speech from the noisy speech using cues such as the interaural time difference（ITD）,the interaural intensity difference（IID） and the masking effect.This algorithm suppresses more kinds of noise with less speech distortion than single-microphone speech enhancement methods.Tests show that the algorithm increases the SNR of 3 kinds of noisy signals from 8~33 dB to 36 dB.The enhanced speech is intelligible and the method handles impulsive noise well.

作者胡奎梁维谦

机构地区清华大学微电子与纳电子学系清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2011年第9期1176-1179,1186,共5页 Journal of Tsinghua University(Science and Technology)

基金国家"八六三"高技术项目(2008AA010700)

关键词语音增强听觉场景分析耳间延时差耳间能量差声学掩蔽 speech enhancement auditory scene analysis interaural time differences（ITD） interaural intensity differences（IID） masking effect

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1Cherry E C. Some experiments on the recognition of speech with one and with two cars[J]. J of ASA, 1953, 25: 975- 979.
2Bregman A S. Auditory Scene Analysis [M]. Cambridge: MIT Press, 1990.
3Hansler E, Schmidt G. Topics in Acoustic Echo and Noise Control [M]. Berlin: Springer, 2006.
4Roman N, Wang D L, Brown G J. Speech segregation based on sound localization [J].J of ASA, 2003, 114(4) : 2236 -2252.
5Meddis R. Simulation of mechanical to neural transduction in the auditory receptor [J]. J of ASA, 1988, 83(3): 1056 - 1063.
6Berouti M, Schwartz M, Makhoul J. Enhancement of speech corrupted by acoustic noise [J]. Proc IEEE Int Conf Acoust, Speech, Signal Process, 1979 : 208 - 211.
7Scalart P, Filho J. Speech enhancement based on a priori signal to noise estimation [J]. Proc IEEE Int Con f Acoust, Speech, Signal Process, 1996:629 - 632.
8Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error log spectral amplitude estimator [J].IEEE Trans Acoust, Speech, Signal Process, 1985 : 23(2) : 443 - 445.

同被引文献14

1JIN Zhaozhang,WANG Deliang.Reverberant speech segregation based on multipitch tracking and classification[J].IEEE Trans Audio,Speech,and Language Processing,2011,19(8):2328-2337.
2ZHANG Xiaojia,SHAO Yang,WANG Deliang.CASA-based robust speaker identification[J].IEEE Trans Audio,Speech,and Language Processing,2012,20(5):1608-1616.
3CHAO Ling,WANG Deliang,Jang R,et al.A tandem algorithm for singing pitch extraction and voice separation from Music Accompaniment[J].IEEE Trans Audio,Speech,and Language Processing,2012,20(5):1482-1491.
4HU Guoning,WANG Deliang.Auditory segmentation based on onset and offset analysis[J].IEEE Trans Audio,Speech,and Language Processing,2007,15(2):396-405.
5Martin C,Hershey J,Rennie S.Monaural speech separation and recognition challenge[J].Computer Speech and Language,2010,24(1):1-15.
6SueH,Jon B,Grown B.Mask estimation for missing data speech recognition based on statistics of binaural interaction[J].IEEE Trans Audio,Speech,and Language Processing,2006,14(1):58-67.
7Nima Y,Philipos L.A dual microphone speech enhancement algorithm based on the coherence function[J].IEEE Trans Audio,Speech,and Language Processing,2012,20(2):599-609.
8FathiK,Mondher F,Mohamed G,et al.Dual-channel spectral subtraction algorithms based speech enhancement dedicated to a bilateral cochlear implant[J].Appl Acoust,2012,73(1):12-20.
9WANG Deliang,Brown G.Computational Auditory Scene Analysis:Principles,Algorithms,and Applications[M].New Jersey:IEEE Press,2006.
10Young S,Evermann G,Gales M,et al.The HTK Book(HTK version 3.4.1)[M].Cambridge:Cambridge University,2009.

引证文献1

1蒋毅,刘润生,冯振明.基于听感知特性的双麦克风近讲语音增强算法[J].清华大学学报（自然科学版）,2014,54(9):1179-1183. 被引量：1

二级引证文献1

1葛宛营,张天骐.基于掩蔽估计与优化的单通道语音增强算法[J].计算机应用,2019,39(10):3065-3070. 被引量：9

1刘闻.基于听觉场景分析的局部放电降噪算法研究[J].电子质量,2016,0(10):19-21.
2吴镇扬,张子瑜,李想,赵力.听觉场景分析的研究进展[J].电路与系统学报,2001,6(2):68-73. 被引量：9
3孙暐,吴镇扬.多带抗噪声语音识别算法研究[J].信号处理,2006,22(4):559-563.
4王想实.听觉场景分析简析[J].技术与市场,2011,18(6):222-222.
5吴迪,陶智,张晓俊,周燕,潘欣裕,肖仲喆,赵鹤鸣.感知听觉场景分析的说话人识别[J].声学学报,2016,41(2):260-272. 被引量：4
6蒋毅,刘润生,冯振明.基于听感知特性的双麦克风近讲语音增强算法[J].清华大学学报（自然科学版）,2014,54(9):1179-1183. 被引量：1
7王卫华,黄凤岗.基于计算听觉场景分析的语音盲分离方法[J].哈尔滨工程大学学报,2008,29(4):395-399. 被引量：1
8李从清,孙立新,龙东,任晓光.语音分离技术的研究现状与展望[J].声学技术,2008,27(5):779-787. 被引量：10
9曾学文,侯自强.MPEG音频编码的高效算法研究及单片DSP实现[J].应用声学,2000,19(1):8-15. 被引量：2
10孙暐,吴镇扬,刘海滨,周琳.并行子带HMM最大后验概率自适应非线性类估计算法[J].电路与系统学报,2005,10(6):20-24. 被引量：1

清华大学学报（自然科学版）

2011年第9期

浏览历史

内容加载中请稍等...

基于听觉场景分析的近讲语音增强算法被引量：1

参考文献8

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于听觉场景分析的近讲语音增强算法 被引量：1

参考文献8

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于听觉场景分析的近讲语音增强算法被引量：1