DNN与谱减法相结合的语音分离技术被引量：2

Speech Separation Combined with DNN and Spectral Subtraction

下载PDF

导出

摘要针对传统DNN语音分离中噪声干扰的问题,提出了一种在DNN语音分离后期处理中结合DNN和谱减法的语音分离方法。首先提取语音声级特征,通过DNN学习带噪特征到分离目标语音的映射,得到分离目标语音;然后对分离目标语音中每一时频单元进行噪声能量估计;最后,通过快速傅里叶逆变换得到谱减后的分离语音波形信号。通过对不同类型的噪声和不同输入信噪比混合后的语音信号进行试验,结果表明,加入谱减法后分离的语音信号与只经DNN网络输出的语音信号相比,前者分离的语音可懂度和信噪比得到了显著提高,并且分离语音的信号更接近于纯净语音的信号。 In view of the problem of noise interference in traditional DNN speech separation,a speech separation method based on DNN and spectral subtraction was proposed in the post processing of DNN speech separation.Firstly,the features of speech were extracted and the DNN was used to learn the mapping of the noisy features to the separated target speech.Then the noise energy is estimated for each time frequency unit in the separated target speech.Finally,the speech waveform was obtained by the inverse fast fourier transform.By testing the speech signal mixed by different types of noise and different input SNR,the experimental results show that compared with the speech signal output only by the DNN network,the speech signal separated after adding spectral subtraction is significantly improved in the speech intelligibility and signal to noise ratio of the proposed algorithm.The similarities between the separated speech signal and the original clean speech signal has also been greatly improved.

作者冯利琪江华闫格闵长伟李玲香 FENG Li-qi;JIANG Hua;YAN Ge;MIN Chang-wei;LI Ling-xiang(Key Laboratory of Granular Computing and Application,Minnan Normal University;School of Computer Science, Minnan Normal University, Zhangzhou 363000,China;School of Electronics and Information Engineering,Hunan University of Science and Engineering,Yongzhou 425199,China)

机构地区闽南师范大学粒计算及其应用重点实验室闽南师范大学计算机学院湖南科技学院电子与信息工程学院

出处《软件导刊》 2018年第12期12-17,共6页 Software Guide

基金国家自然科学基金项目(61472406) 福建省自然科学基金项目(2016J01304) 闽南师范大学人才引进项目

关键词语音分离神经网络谱减法目标语音噪声能量估计 speech separation neural networks spectral subtraction target speech noise energy estimation

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：70
2韩伟,张雄伟,周星宇,白崧廷,闵刚.联合优化深度神经网络和约束维纳滤波的单通道语音增强方法[J].计算机应用研究,2017,34(3):706-709. 被引量：6

二级参考文献68

1邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
2Kim G, Lu Y, Hu Y, Loizou P C. An algorithm that im- proves speech intelligibility in noise for normal-hearing lis- teners. The Journal of the Acoustical Society of America, 2009, 126(3): 1486-1494.
3Dillon H. Hearing Aids. New York: Thieme, 2001.
4Allen J B. Articulation and intelligibility. Synthesis Lectures on Speech and Audio Processing, 2005, 1(1): 1-124.
5Seltzer M L, Raj B, Stern R M. A Bayesian classifier for spectrographic mask estimation for missing feature speech recognition. Speech Communication, 2004, 43(4): 379-393.
6Weninger F, Erdogan H, Watanabe S, Vincent E, Le Roux J, Hershey J R, Schuller B. Speech enhancement with LSTM recurrent neural networks and its application to noise-robust ASR. In: Proceedings of the 12th International Conference on Latent Variable Analysis and Signal Separation. Liberec, Czech Republic: Springer International Publishing, 2015.91 -99.
7Weng C, Yu D, Seltzer M L, Droppo J. Deep neural networks for single-channel multi-talker speech recognition. IEEE/ ACM Transactions on Audio, Speech, and Language Pro- cessing, 2015, 23(10): 1670-1679.
8Boll S F. Suppression of acoustic noise in speech using spec- tral subtraction. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1979, 27(2): 113-120.
9Chen J D, Benesty J, Huang Y T, Doclo S. New insights into the noise reduction wiener filter. IEEE Transactions on Audio, Speech, and Language Processing, 2006, 14(4): 1218 -1234.
10Loizou P C. Speech Enhancement: Theory and Practice. New York: CRC Press, 2007.

共引文献74

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：14
2向前,唐勇.基于生成对抗网络的汉语语音增强技术研究[J].计算机应用研究,2020,37(S02):150-151. 被引量：2
3杨海龙,曾祥福,钟维良.多尺度时域单通道语音分离网络设计[J].电声技术,2021,45(10):96-99.
4黄张翼,周翊,舒晓峰,刘宏清.联合贝叶斯估计与深度神经网络的语音增强方法[J].小型微型计算机系统,2019,40(1):40-44. 被引量：5
5吕菲,夏秀渝.基于方位特征的听觉选择性注意计算模型研究[J].自动化学报,2017,43(4):634-644. 被引量：5
6支艳利,张云伟.基于环形麦克风阵列的远场语音识别系统[J].微型电脑应用,2017,33(4):62-64. 被引量：2
7王程,周婉,何军.面向自动音乐生成的深度递归神经网络方法[J].小型微型计算机系统,2017,38(10):2412-2416. 被引量：14
8袁文浩,孙文珠,夏斌,欧世峰.利用深度卷积神经网络提高未知噪声下的语音增强性能[J].自动化学报,2018,44(4):751-759. 被引量：39
9凌佳佳,袁晓兵.联合噪声分类和掩码估计的语音增强方法[J].电子设计工程,2018,26(17):30-34. 被引量：3
10袁文浩,梁春燕,夏斌,孙文珠.一种融合相位估计的深度卷积神经网络语音增强方法[J].电子学报,2018,46(10):2359-2366. 被引量：7

同被引文献4

1梁尧,朱杰,马志贤.基于深度神经网络的单通道语音分离算法[J].信息技术,2018,42(7):24-27. 被引量：4
2范存航,刘斌,陶建华,温正棋,易江燕.一种基于卷积神经网络的端到端语音分离方法[J].信号处理,2019,35(4):542-548. 被引量：12
3周晓东,陈人楷,孙华星,莫钞然.基于注意力机制的单通道双人语音分离研究[J].通信技术,2020,53(4):880-884. 被引量：3
4景源,孙浩源.基于卷积神经网络的时域语音盲分离方法研究[J].辽宁大学学报（自然科学版）,2021,48(3):204-214. 被引量：1

引证文献2

1陈瑶.基于深度学习的单音源语音分离方法研究[J].电声技术,2022,46(4):47-49.
2王先宇,张二华.基于长短时记忆模型的信噪分离[J].计算机与数字工程,2022,50(9):2037-2041.

1陈斌杰,陆志华,周宇,叶庆卫.基于双麦克风的室内语音分离与声源定位系统[J].计算机应用,2018,38(12):3643-3648. 被引量：3
2季策,祝雯靖.有效降低系统PAPR的低复杂度SLM方案[J].系统工程与电子技术,2018,40(12):2833-2838. 被引量：1
3冯磊,杨兴华,刘培坤,张悦刊,周振.母子旋流器分离性能试验研究[J].煤炭技术,2018,37(12):236-239.
4史嫣,彭昭,刘柯岩,汪涛.前列腺癌外周血循环肿瘤细胞新检测技术应用进展[J].肿瘤研究与临床,2018,30(11):789-792. 被引量：6
5刘磊磊,肖卓炳.野菊花的化学成分研究[J].中草药,2018,49(22):5254-5258. 被引量：30
6刘波宁,翟东海.基于双鉴别网络的生成对抗网络图像修复方法[J].计算机应用,2018,38(12):3557-3562. 被引量：11
7陈立芳,陈哲超,王维民,秦悦,李兆举,晏资文.基于自适应粒子群优化的非稳态自动平衡控制算法研究[J].振动与冲击,2018,37(24):131-136. 被引量：13
8许茗,于晓升,陈东岳,吴成东,贾同,茹敬雨.复杂热红外监控场景下行人检测[J].中国图象图形学报,2018,23(12):1829-1837. 被引量：14
9句建国,邢进生,王冬冬.基于BP-NN的热连轧产品性能自适应逆控制模型[J].计算机技术与发展,2018,28(12):185-189. 被引量：2

软件导刊

2018年第12期

浏览历史

内容加载中请稍等...

DNN与谱减法相结合的语音分离技术被引量：2

参考文献2

二级参考文献68

共引文献74

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

DNN与谱减法相结合的语音分离技术 被引量：2

参考文献2

二级参考文献68

共引文献74

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

DNN与谱减法相结合的语音分离技术被引量：2