基于波束形成与最大似然估计的近距离双麦克风语音增强算法被引量：3

Beamforming and maximum likelihood estimation for speech enhancement using dual closely-spaced microphones

导出

摘要为了解决波束形成法直接应用于近距离双麦克风系统时存在的问题,如目标信号低频段能量损失、多方向的竞争性语音噪声难以被有效抑制等,该文提出一种基于波束形成与最大似然估计的两步去噪方法。该方法首先使用加权叠加滤波器对混合声源进行时频分解,然后通过2个零点分别在0°和180°的波束形成图的幅频响应比值,设置各时频单元所对应的初步掩蔽值,在避免低频滚降现象出现的情况下,抑制本底噪声;最后根据统计模型和简化的最大似然估计法,抑制多方向的竞争性语音噪声,进一步增强目标信号。测试结果表明：在低信噪比、多种类型噪声源共同存在的情境下,该方法可以在无需低通滤波或宽带波束补偿的情况下,恢复原始信号的能量分布特点,明显提升信噪比。 Traditional beamforming systems using dual closely-spaced microphones have various problems such as low-frequency-roll-off and limitations in suppressing competitive speech noises from multiple directions. This paper presents a two-step beamforming and maximum likelihood estimation algorithm. The algorithm first uses a WOLA filter for the time-frequency analysis for the speech mixture and then sets mask values to suppress background noise without low-frequency-roll-off based on the ratio of the two beamforming patterns, which have zeros at 0°and 180°. A statistical model and the maximum likelihood estimation are then used to further enhance thespeech. Tests indicate that the algorithm effectively recovers the energy distribution of the target signal and improves the signal-to-noise ratio without a low-pass filter or broadband compensation when the signal-to-ratio is low or multiple kinds of noises exist.

作者宫琴郑硕 GONG Qin;ZHENG Shuo(Department of Biomedical Engineering, Tsinghua University, Beijing 100084, China;Research Center of Biomedical Engineering, Graduate School at Shenzhen, Tsinghua University Shenzhen 518055, China)

机构地区清华大学生物医学工程系清华大学深圳研究生院、生物医学研究中心

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第6期603-608,共6页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(61271133) 高等学校博士学科点专项科研基金资助项目(20120002110054) 清华信息科学与技术国家实验室(筹)学科交叉基金资助项目(042003172) 深圳市自然科学基金资助项目(JCYJ20140827160046745)

关键词近距离双麦克风波束形成最大似然估计低频滚降多方向竞争性语音噪声 closely-spaced dual microphones beamforming maximum likelihood estimation low-frequency roll-off competitive speech noises from multiple directions

分类号 TN912.16 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1崔杰,肖灵,王玥,孟晓辉,刘亭亭.一种用于数字助听器的WOLA滤波器组的设计准则[J].应用声学,2010,29(1):36-42. 被引量：7

二级参考文献13

1King Chung. Challenges and Recent Developments in Hearing Aids: Part I. Speech Understanding in Noise, Microphone Technologies and Noise Reduction Algorithms. Trends In Amplification, 2004, 8(3): 83-124.
2R. E. Crochiere, L. R. Rabiner. Multirate Digital Signal Processing. NJ: Englewood Cliffs, Prentice-Hall, 1983: 289-341.
3P. P. Vaidyanathan. Multrirate Systems and Filterbanks. NJ: Englewood Cliffs, Prentice-Hall, 1993: 286-392.
4S.M. Ahadi, H. Sheikhzadeh, R.L. Brennan, et al. An Efficient Front-End for Automatic Speech Recognition. IEEE International Conference on Electronics, Circuits and Systems, 2003, 1: 128-131.
5O. Romain,B. Denby. Prototype of a Software Defined Broadcast Media Indexing Engine. IEEE International Conference on Acoustics, Speech, and Signal Processing 2007, 2: 11813-11816.
6Z. Cvetkovie, M. Vetterli. Oversampled Filter Banks. IEEE Transactions on signal processing, 1998, 46(5): 1245-1255.
7M. R. Wilbur, T. N. Davidson, J. P. Reilly. Efficient Design of Oversampled NPR GDFT Filterbanks. IEEE Transactions on signal processing, 2004, 52(7): 1947-1963.
8C. D. Creusere, S. K. Mitra. A Simple Method for Designing High-Quality Prototype Filters of M-band Pseudo QMF banks. IEEE Transactions on signal Processing, 1995, 43(4): 1005-1007.
9Y. E Lin, E P. Vaidyanathan. A Kaiser Window Approach for the Design of Prototype Filters of Cosine Modulated Filterbanks. IEEE Signal Processing Letters, 1998, 5(6): 132-134.
10D. Hermann, E. Chau, R. D. Dony, et al. Window Based Prototype Filter Design for Highly Oversampled Filter Banks in Audio Applications. IEEE International Conference on Acoustics, Speech, and Signal Processing, 2007, 2: 11405-11408.

共引文献6

1Jianwen Li,Ziyu Li,Xuezong Ma.Reception of infrasound and audio current in derma nerves[J].Neural Regeneration Research,2010,5(18):1413-1417. 被引量：1
2何艳辉,梁维谦,董保帅,张浩.基于频域的数字助听器中的啸叫检测与抑制[J].电声技术,2012,36(8):39-42. 被引量：5
3郭连平,田书林,王志刚,罗浚溢.WOLA滤波器组在宽带数字中频处理中的应用[J].计量学报,2013,34(5):486-490. 被引量：3
4Jianwen Li,Yan Li,Ming Zhang,Weifang Ma,Xuezong Ma.Cutaneous sensory nerve as a substitute for auditory nerve in solving deaf-mutes' hearing problem: an innovation in multi-channel-array skin-hearing technology[J].Neural Regeneration Research,2014,9(16):1532-1540. 被引量：2
5张勇成,陈华伟.面向中频段听阈突变听力损失的非均匀滤波器组设计[J].应用声学,2022,41(4):634-645. 被引量：1
6王鹏,梁维谦.适于助听器的加权叠加滤波器组参数设计[J].集美大学学报（自然科学版）,2023,28(1):91-96.

同被引文献40

1梅继丹,石文佩,马超,孙大军.近场反卷积聚焦波束形成声图测量[J].声学学报,2020,45(1):15-28. 被引量：14
2张贤达,保铮.盲信号分离[J].电子学报,2001,29(z1):1766-1771. 被引量：210
3邓兆祥,张伟,卢海峰.声强测量技术及其在内燃机噪声源识别中的应用[J].内燃机,1994,10(2):29-34. 被引量：6
4吴昊,张碧星,汪承灏.声波在固体板中的多径传播及其时间反转声场[J].声学学报,2005,30(3):215-221. 被引量：18
5何祚镛.声学逆问题——声全息场变换技术及源特性判别[J].物理学进展,1996,16(3):600-612. 被引量：39
6惠娟,胡丹,惠俊英,殷敬伟.聚焦波束形成声图测量原理研究[J].声学学报,2007,32(4):356-361. 被引量：49
7宋艳华,姜哲.测量点位置对声源识别的影响[J].振动与冲击,2008,27(3):35-37. 被引量：8
8王强,袁慎芳.主动Lamb波结构健康监测中信号增强与损伤成像方法[J].航空学报,2008,29(4):1061-1067. 被引量：29
9时洁,杨德森,刘伯胜,宋海岩.基于MVDR聚焦波束形成的辐射噪声源近场定位方法[J].大连海事大学学报,2008,34(3):55-58. 被引量：32
10舒歌群,郝志勇,谭从民.内燃机噪声测量中的声强测试技术[J].内燃机学报,1998,16(1):69-74. 被引量：38

引证文献3

1陈又圣,张春晓,林炜臻,颜桂灵,林崇博,李国昱,叶伟坚,马里东.方向性麦克风的极性图特性及增益变化特征研究[J].中国医学物理学杂志,2018,35(12):1468-1472. 被引量：1
2宫琴,饶诚,郑硕.抑制多方向语音噪声的人工耳蜗语音增强算法[J].清华大学学报（自然科学版）,2020,60(2):181-188.
3赵卫东,徐鑫蔚,宋睿,杨明亮.汽车异响噪声源定位方法研究进展与展望[J].重庆理工大学学报（自然科学）,2022,36(10):73-83. 被引量：2

二级引证文献3

1张春晓,陈又圣,黄鸿展.基于拉格朗日插值的电子耳蜗分数延迟和参数失配分析[J].中国医学物理学杂志,2021,38(4):468-471. 被引量：1
2刘均建,胡顺仁,李双,陈明家.一种平面差分传声器阵列的声成像算法[J].重庆理工大学学报（自然科学）,2023,37(10):279-287.
3唐洵睿,钱晓昱,王子源,孟桥.一种基于非均匀线性麦克风阵列的窄带声源定向方法及系统[J].电子器件,2024,47(1):116-121.

1陈步超.太原某五星级酒店空调系统设计[J].中外建筑,2018,0(6):157-159.
2梁世蒙,高海良,黄伟,刘德波.相控阵聚焦法则设置对成像效果的影响研究[J].无损探伤,2018,42(1):12-15. 被引量：1
3李志军.都匀市某综合体暖通空调设计[J].建材与装饰,2018,14(17):200-201.
4易武,王鸣,于冬升,韩晶晶,张金团.考虑地层岩性及地质构造的区域边坡岩体完整程度预测[J].重庆交通大学学报（自然科学版）,2018,37(5):60-64. 被引量：1
5赵海涛,刘乃全.农民工跨城市二次流动与回流模式——基于最大似然估计方法的分析[J].财经论丛,2018(6):3-11. 被引量：7
6孟天怀,包清.利用本底噪声检验视频证据属性的研究[J].警察技术,2018(3):49-52.
7吴春香,张建明.无线感知网络中动作识别的滤波算法[J].计算机技术与发展,2018,28(5):86-89.
8李志娟.基于GIS的呼和浩特市学校选址研究[J].环球市场,2017,0(28):73-74.
9孔选林,陈辉,胡治权,康佳星,徐天吉,李录明.多分量地震数据矢量滤波面波压制方法（英文）[J].Applied Geophysics,2018,15(1):99-110. 被引量：1
10周航,史治宇.基于改进MODWPT时频分解的时变系统参数识别[J].低温建筑技术,2018,40(3):43-47. 被引量：1

清华大学学报（自然科学版）

2018年第6期

浏览历史

内容加载中请稍等...

基于波束形成与最大似然估计的近距离双麦克风语音增强算法被引量：3

参考文献1

二级参考文献13

共引文献6

同被引文献40

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于波束形成与最大似然估计的近距离双麦克风语音增强算法 被引量：3

参考文献1

二级参考文献13

共引文献6

同被引文献40

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于波束形成与最大似然估计的近距离双麦克风语音增强算法被引量：3