工业噪声环境下多麦状态空间模型语音增强算法被引量：3

Speech enhancement using multi-microphone state space model under industrial noise environment

下载PDF

导出

摘要在协同作业的工业环境中进行语音通信时,语音往往会淹没于工业噪声中,致使语音通信的有效性受到影响。针对这种工业噪声下的语音环境,提出了一种采用多麦克风的卡尔曼语音增强算法。该算法简化了状态空间模型(SSM)中的差分方程以降低复杂度,每个采样点实时得到去噪信号从而增强了实时性。另外,为了进一步简化复杂度,还利用最小二乘原则来对语音进行增强。实验中采用了公开数据库的语音信号和工厂噪声信号来模拟多麦下的带噪语音,将所提算法与传统算法进行了对比。实验结果表明,所提算法的输出语噪比(增强后的语音与残留噪声之比)优于传统算法约2 dB,而运行时间仅不到传统算法的2%,且延迟时间仅是毫秒级。 When a speech communication is performed in the industrial environment of collaborative operation,the speech is often submerged in the industrial noise.In this case,the effectiveness of speech communication is affected.For the speech environment with industrial noise,a Kalman speech enhancement algorithm using multi-microphone was proposed.In the algorithm,the difference equation in the State Space Model(SSM)was simplified to reduce the complexity,and the denoising signal was obtained in each sampling point to improve the real-time performance.In addition,to further simplify the complexity,the least square method was used to enhance the speech.In experiments,the speech signals and factory noise signals from a public database were used to simulate the noisy speech under multi-microphone environment,and the proposed algorithm was compared with the traditional algorithm.The experimental results show that the proposed algorithm has the output speech-to-noise ratio(a ratio of enhanced speech to residual noise)higher than the traditional algorithm by about 2 dB,and the running time less than 2%of that of the traditional algorithm.At the same time,the delay time of the algorithm is only several milliseconds.

作者吴庆贺吴海锋沈勇曾玉 WU Qinghe;WU Haifeng;SHEN Yong;ZENG Yu(School of Electric and Informative Engineering,Yunnan Minzu University,Kunming Yunnan 650504,China)

机构地区云南民族大学电气信息工程学院

出处《计算机应用》 CSCD 北大核心 2020年第5期1476-1482,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(61762093) 云南省应用基础研究重点项目(2018FA036) 云南省高校科技创新团队。

关键词工业噪声状态空间模型多麦克风语音增强 industrial noise State Space Model(SSM) multi-microphone speech enhancement

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1章雒霏,张铭,李晨.一种改进的手机双麦克风消噪系统[J].应用声学,2017,36(1):32-40. 被引量：2
2jing wang,xiang xie,jingming kuang.Microphone Array Speech Enhancement Based on Tensor Filtering Methods[J].China Communications,2018,15(4):141-152. 被引量：3
3刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：67
4章雒霏,张铭,李晨.一种新的语音和噪声活动检测算法及其在手机双麦克风消噪系统中的应用[J].电子与信息学报,2016,38(8):2020-2026. 被引量：2

二级参考文献70

1Kim G, Lu Y, Hu Y, Loizou P C. An algorithm that im- proves speech intelligibility in noise for normal-hearing lis- teners. The Journal of the Acoustical Society of America, 2009, 126(3): 1486-1494.
2Dillon H. Hearing Aids. New York: Thieme, 2001.
3Allen J B. Articulation and intelligibility. Synthesis Lectures on Speech and Audio Processing, 2005, 1(1): 1-124.
4Seltzer M L, Raj B, Stern R M. A Bayesian classifier for spectrographic mask estimation for missing feature speech recognition. Speech Communication, 2004, 43(4): 379-393.
5Weninger F, Erdogan H, Watanabe S, Vincent E, Le Roux J, Hershey J R, Schuller B. Speech enhancement with LSTM recurrent neural networks and its application to noise-robust ASR. In: Proceedings of the 12th International Conference on Latent Variable Analysis and Signal Separation. Liberec, Czech Republic: Springer International Publishing, 2015.91 -99.
6Weng C, Yu D, Seltzer M L, Droppo J. Deep neural networks for single-channel multi-talker speech recognition. IEEE/ ACM Transactions on Audio, Speech, and Language Pro- cessing, 2015, 23(10): 1670-1679.
7Boll S F. Suppression of acoustic noise in speech using spec- tral subtraction. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1979, 27(2): 113-120.
8Chen J D, Benesty J, Huang Y T, Doclo S. New insights into the noise reduction wiener filter. IEEE Transactions on Audio, Speech, and Language Processing, 2006, 14(4): 1218 -1234.
9Loizou P C. Speech Enhancement: Theory and Practice. New York: CRC Press, 2007.
10Liang S, Liu W J, Jiang W. A new Bayesian method incor- porating with local correlation for IBM estimation. IEEE Transactions on Audio, Speech, and Language Processing, 2013, 21(3): 476-487.

共引文献70

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：13
2杨海龙,曾祥福,钟维良.多尺度时域单通道语音分离网络设计[J].电声技术,2021,45(10):96-99.
3黄张翼,周翊,舒晓峰,刘宏清.联合贝叶斯估计与深度神经网络的语音增强方法[J].小型微型计算机系统,2019,40(1):40-44. 被引量：5
4吕菲,夏秀渝.基于方位特征的听觉选择性注意计算模型研究[J].自动化学报,2017,43(4):634-644. 被引量：5
5支艳利,张云伟.基于环形麦克风阵列的远场语音识别系统[J].微型电脑应用,2017,33(4):62-64. 被引量：2
6王程,周婉,何军.面向自动音乐生成的深度递归神经网络方法[J].小型微型计算机系统,2017,38(10):2412-2416. 被引量：14
7袁文浩,孙文珠,夏斌,欧世峰.利用深度卷积神经网络提高未知噪声下的语音增强性能[J].自动化学报,2018,44(4):751-759. 被引量：36
8李志生,蔡志兵,孙明,宋德周,杨志林.基于MTK平台的智能数字加模拟对讲技术[J].电子测量技术,2018,41(10):59-65.
9凌佳佳,袁晓兵.联合噪声分类和掩码估计的语音增强方法[J].电子设计工程,2018,26(17):30-34. 被引量：3
10袁文浩,梁春燕,夏斌,孙文珠.一种融合相位估计的深度卷积神经网络语音增强方法[J].电子学报,2018,46(10):2359-2366. 被引量：7

同被引文献25

1王文益,伊雪.基于改进语音存在概率的自适应噪声跟踪算法[J].信号处理,2020,36(1):32-41. 被引量：7
2张明亮,陈雨.基于全卷积神经网络的语音增强算法[J].计算机应用研究,2020,37(S01):135-137. 被引量：7
3郭应时,王畅,张亚岐.噪声方差对卡尔曼滤波结果影响分析[J].计算机工程与设计,2014,35(2):641-645. 被引量：12
4洪灿梅,刘爱莲,刘名扬,程航,田素辉.FIR滤波器与IIR滤波器去噪效果对比研究[J].微型机与应用,2015,34(21):67-69. 被引量：13
5毕天姝,陈亮,薛安成,杨奇逊.基于鲁棒容积卡尔曼滤波器的发电机动态状态估计[J].电工技术学报,2016,31(4):163-169. 被引量：33
6王艳,臧天磊,符玲,何正友.基于谐波源特征提取的电力系统动态谐波状态估计自适应方法[J].电网技术,2018,42(8):2612-2619. 被引量：17
7董胡,徐雨明,马振中,李列文,任可.基于小波包与自适应维纳滤波的语音增强算法[J].计算机技术与发展,2020,30(1):50-53. 被引量：9
8崔永林,席燕辉,张小东.基于自适应卡尔曼滤波残差分析的谐波检测[J].电力系统保护与控制,2019,47(24):92-100. 被引量：21
9高登峰,杨波,刘洪,杨红雨.多特征全卷积网络的地空通话语音增强方法[J].四川大学学报（自然科学版）,2020,57(2):289-296. 被引量：7
10孔德廷.一种改进的基于对数谱估计的语音增强算法[J].声学技术,2020,39(2):208-213. 被引量：3

引证文献3

1孙立辉,曹丽静,张竟雄.基于升降编解码全卷积神经网络语音增强技术[J].智能计算机与应用,2021,11(2):19-22.
2陈彪,方旭峰,陈识微.有限脉冲响应滤波器在电力系统谐波鲁棒估计中的应用[J].能源与环保,2021,43(4):217-222. 被引量：1
3徐明红.铝冶炼生产中的降噪分析[J].中国机械,2023(18):40-43.

二级引证文献1

1蒋芳华.变频器驱动双电机谐波状态估计方法[J].电工技术,2022(7):123-126.

1彦哲.利刃在手,谁是凶手? 《利刃出鞘》：一场人性的终极拷问[J].世界博览,2019,0(24):54-57.
2张恒璟,陆帝,文汉江,程鹏飞,崔东东.一种IGS站高程时间序列分析方法[J].遥感信息,2019,34(6):1-5. 被引量：3
3贾蕾.运用英语绘本,优化英语教学[J].小学时代,2020,0(7):25-26.
4周晓敏,刘海颖,张俊杰.基于RWTLS的Allan方差算法简化[J].测绘通报,2020(3):44-47. 被引量：1
5陈红.翻转课堂在高校剑桥商务英语口语培训中的应用及应遵循的基本原则[J].昌吉学院学报,2020,0(1):117-121. 被引量：2
6时文华,张雄伟,邹霞,孙蒙,李莉.联合深度编解码网络和时频掩蔽估计的单通道语音增强[J].声学学报,2020,45(3):299-307. 被引量：11
7郑鑫江,许枫,杨娟.一种改进的水下小目标跟踪算法仿真[J].计算机仿真,2020,37(1):244-248.
8张建华,叶建文,李方方.隐性知识外显案例之多案例诱导型适配研究[J].情报理论与实践,2020,43(1):98-103. 被引量：6
9刘伟波,曾庆宁,罗瀛,郑展恒.低信噪比环境下语音识别的鲁棒性方法研究[J].声学技术,2019,38(6):650-656. 被引量：6
10黄冠宝(摄影),无.黄河美景——若诗·若画·若尔盖[J].中国民政,2020(6).

计算机应用

2020年第5期

浏览历史

内容加载中请稍等...

工业噪声环境下多麦状态空间模型语音增强算法被引量：3

参考文献4

二级参考文献70

共引文献70

同被引文献25

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

工业噪声环境下多麦状态空间模型语音增强算法 被引量：3

参考文献4

二级参考文献70

共引文献70

同被引文献25

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

工业噪声环境下多麦状态空间模型语音增强算法被引量：3