结合波束形成和GAN网络的多通道语音增强研究被引量：5

Multi-channel Speech Enhancement based on Beamforming and GAN Network

下载PDF

导出

摘要后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比。但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡。本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法。前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程。实验系统是通过MATLAB和Tensor Flow仿真实现,结果证明了该方法的有效性。 Post filtering process is a common technique in multi-channel speech enhancement system. Its purpose is to further improve the performance of speech enhancement system and improve the output signal-to-noise ratio after beamforming. In order to realize the reasonable tradeoff between noise suppression and speech quality, the commonly used post-filtering methods require a rather cumbersome process of parameter adjustment. In this paper, a new multi-channel speech enhancement algorithm combined beamforming method based on minimum variance distortionless（MVDR） and generative adversarial neural networks（GAN） is proposed. The beamformer is used in the front end to preliminary enhance the signal. The back-end filter use the proposed GAN to enhance the speech signal, which avoids the complicated parameter adjustment process. The experimental system is realized by Matlab and Tensor Flow simulation. The results show that the method is effective.

作者余亮吴海军蒋伟康 YU Liang;WU Haijun;JIANG Weikang(State Key Laboratory of Mechanical System and Vibration, Shanghai Jiaotong University, Shanghai 200240, Chin)

机构地区上海交通大学机械系统与振动国家重点实验室

出处《噪声与振动控制》 CSCD 2018年第A02期591-596,共6页 Noise and Vibration Control

基金国家自然科学基金青年基金资助项目(11704248)

关键词声学语音增强波束形成最小方差无畸变生成对抗深层神经网络 acoustics speech enhancement beamforming MVDR GAN

分类号 O422.6 [理学—声学]

引文网络
相关文献

同被引文献33

1曾庆宁,欧阳缮.基于阵列抗串扰自适应噪声抵消与谱相减相结合的语音增强[J].声学学报,2007,32(3):250-257. 被引量：4
2李关防,惠俊英.基于经验模态分解的模态域MVDR方法研究[J].电子学报,2009,37(5):942-946. 被引量：9
3袁坤,梁维谦,张国先.基于等边三角形麦克风阵列的语音增强[J].清华大学学报（自然科学版）,2009(7):987-990. 被引量：5
4黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
5屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6
6王方杰,金赟.基于维纳滤波的数字助听器语音增强算法[J].电子器件,2017,40(4):1021-1025. 被引量：3
7徐必伟,苏成利,杨微,曹江涛.基于DTW和EMD的孤立词语音识别研究[J].辽宁石油化工大学学报,2018,38(1):74-78. 被引量：2
8刘莹,赵彤洲,江逸琪,柴悦,李翔.基于自相关函数的钢琴乐音改进识别算法[J].武汉工程大学学报,2018,40(2):208-213. 被引量：6
9王义圆,张曦文,周贻能,黄际彦.基于麦克风阵列的语音增强与干扰抑制算法[J].电声技术,2018,42(2):1-5. 被引量：6
10毛维,曾庆宁,龙超.双微阵列语音增强算法在说话人识别中的应用[J].声学技术,2018,37(3):253-260. 被引量：2

引证文献5

1李恝,吴海彬,叶锦华.改进经验模态分解的麦克风阵列语音增强方法[J].福州大学学报（自然科学版）,2019,47(6):734-739. 被引量：2
2刘航,李扬,袁浩期,王俊影.基于生成对抗网络的语音信号分离[J].计算机工程,2020,46(1):302-308. 被引量：6
3曾庆宁,王红丽,龙超.一种微型双麦克风语音增强算法[J].现代电子技术,2022,45(6):58-64. 被引量：4
4黎思泉,万永菁,蒋翠玲.基于生成对抗网络去影像的多基频估计算法[J].计算机科学,2022,49(3):179-184. 被引量：3
5李敏,刘冰清,彭庆龙,于淼.基于CycleGAN算法的迷彩服装图案设计方法研究[J].丝绸,2022,59(8):100-106. 被引量：7

二级引证文献22

1曹丽静.语音增强技术研究综述[J].河北省科学院学报,2020,37(2):30-36. 被引量：7
2王涛,全海燕.低信噪比下联合训练生成对抗网络的语音分离[J].计算机工程与科学,2021,43(6):1088-1094.
3黎思泉,万永菁,蒋翠玲.基于生成对抗网络去影像的多基频估计算法[J].计算机科学,2022,49(3):179-184. 被引量：3
4尹文兵,高戈,曾邦,王霄,陈怡.基于时频域生成对抗网络的语音增强算法[J].计算机科学,2022,49(6):187-192. 被引量：2
5李敏,刘冰清,彭庆龙,于淼.基于CycleGAN算法的迷彩服装图案设计方法研究[J].丝绸,2022,59(8):100-106. 被引量：7
6洪育坤,陈燕,邓翔宇,陈科亨,王静.智能玩具车语音控制系统设计[J].电子设计工程,2022,30(19):159-163. 被引量：3
7杨理华,张翔鹏,刘丽滨,艾夏禹,杨军.强环境噪声下船用耳罩语音增强仿真与验证[J].船海工程,2023,52(1):87-92. 被引量：1
8刘玥彤,吴迪,滕华.基于改进胶囊神经网络的乐音主频识别研究[J].南京理工大学学报,2023,47(2):207-213.
9王伟珍,张功.基于CycleGAN的服装图像混搭风格迁移[J].现代纺织技术,2023,31(4):250-258. 被引量：3
10罗宇,胡维平,吴华楠.一种基于聚类的门控卷积网络语声分离方法[J].应用声学,2023,42(5):1099-1105.

1王锦程,苏伟,谢蕾.局域网中深度学习平台构建及应用[J].信息与电脑,2018,0(9):25-29. 被引量：2
2Google发布人工智能芯片TPU 3[J].测控技术,2018,37(5):161-161.

噪声与振动控制

2018年第A02期

浏览历史

内容加载中请稍等...

结合波束形成和GAN网络的多通道语音增强研究被引量：5

同被引文献33

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

结合波束形成和GAN网络的多通道语音增强研究 被引量：5

同被引文献33

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

结合波束形成和GAN网络的多通道语音增强研究被引量：5