基于生成对抗网络合成噪声的语音增强方法研究被引量：5

Research on speech enhancement method based on generating noise using GAN

下载PDF

导出

摘要在语音增强领域,深度神经网络通过对大量含有不同噪声的语音以监督学习方式进行训练建模,从而提升网络的语音增强能力。然而不同类型噪声的获取成本较大,噪声类型难以全面采集,影响了模型的泛化能力。针对这个问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GAN)的噪声数据样本增强方法,该方法对真实噪声数据进行学习,根据数据特征合成虚拟噪声,以此扩充训练集中噪声数据的数量和类型。通过实验验证,所采用的噪声合成方法能够有效扩展训练集中噪声来源,增强模型的泛化能力,有效提高语音信号去噪处理后的信噪比和可理解性。 In the field of speech enhancement,deep neural network can improve the enhancement ability of the model by training and modeling a large number of data with different noises in the supervised learning way.However,the acquisition cost of different types of noise is large and the noise types are difficult to be comprehensive,which affects the generalization ability of the model.Aiming at this problem,this paper proposes a noise data augmentation method based on generative adversarial network(GAN),which learns from the real noise data and synthesizes virtual noises according to the data features,so as to expand the number and type of the noise data in the training set.Experimental results show that the method of noise synthesis adopted in this article can effectively expand the source of noise in the training set,enhance the generalization ability of the model,and effectively improve the signal-to-noise ratio and intelligibility of speech signal after denoising.

作者夏鼎徐文涛 Xia Ding;Xu Wentao(School of Science,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China)

机构地区南京航空航天大学理学院

出处《电子技术应用》 2020年第11期56-59,64,共5页 Application of Electronic Technique

关键词语音增强生成对抗网络数据增强 speech enhancement generative adversarial network data augmentation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1何玉文,鲍长春,夏丙寅.基于AR-HMM在线能量调整的语音增强方法[J].电子学报,2014,42(10):1991-1997. 被引量：6
2王晶,傅丰林,张运伟.语音增强算法综述[J].声学与电子工程,2005(1):22-26. 被引量：21

二级参考文献29

1胡广书.数字信号处理-理论、算法与实现[M].北京:清华大学出版社,2001..
2Gabrea M. Adaptive Kalman filtering-based speech enhancement algorithm. Canadian Conference on Electrical and Computer Engineering, Toronto, 2001.
3Ogata S, Shimamum T. Reinforced spectral subtraction method to enhance speech signal. Proceedings of IEEE Region 10 International Conference on Electrical and Electronic Technology, Singapore, 2001.
4Pei Ding, Zhigang Cao.Combining MMSE enhancement with LA model adaptation for robust automatic speech recognition[J]. Electronics Letters, 2001,37(8):539 - 540.
5Martin R. Speech enhancement using MMSE short time spectral estimation with gamma distributed speech priors. IEEE International Conference on Acoustics, Speech, and Signal Processing, Orlando, 2002.
6ChangHuai You, SooNgee Koh, Rahardja S. Adaptive /spl beta/-order MMSE estimation for speech enhancement. IEEE International Conference on Acoustics, Speech, and Signal Processing, Singapore, 2003.
7Dai Qijun, Chen Yanpu, Bian Zhengzhong. Optimizing speech enhancement based on noise masked probability.2002 6th International Conference on SignalProcessing,, Xi'an, 2002.
8Yi Hu, Loizou P C. Speech enhancement based on wavelet thresholding the multitaper pectrum[J]. IEEE Transactions on Speech and Audio Processing, 2004, 12(1):59- 67.
9Rezayee A, Gazor S. An adaptive KLT approach for speech enhancement[J]. IEEE Transactions on Speech and Audio Processing, 2001, 9(2): 87 - 95.
10Hasan M K, Zilany M S A, Khan M R. DCT speech enhancement with hard and soft thresholding criteria[J].Electronics Letters, 2002,38(13):669 - 670.

共引文献25

1陈芳丽,王璇,王雨,王欢.基于短时谱估计的三种语音增强技术降噪效果的比较[J].科协论坛（下半月）,2009(8):53-54.
2邹大勇,赵建军.基于神经网络的语音增强系统设计[J].科技广场,2006(1):21-23.
3王欣,罗代升,王正勇.基于改进谱减算法的语音增强研究[J].成都信息工程学院学报,2007,22(2):201-204. 被引量：12
4刘鹏,王怀杰.噪音环境下孤立词的语音识别[J].电脑知识与技术,2007(12):1399-1400. 被引量：1
5宁更新,韦岗.一种用于抗噪语音识别的动态参数补偿新方法[J].电路与系统学报,2008,13(2):14-19.
6赵霞.基于正交试验方法进行小波消噪参数选择[J].西安文理学院学报（自然科学版）,2008,11(2):85-88. 被引量：2
7杨琳,张建平,颜永红.单通道语音增强算法对汉语语音可懂度影响的研究[J].声学学报,2010,35(2):248-253. 被引量：17
8李建文,白璐.皮肤听声器的数字化及去噪研究[J].计算机测量与控制,2011,19(3):654-657.
9苗玉杰,刘雪飞,张晓敏.基于CMN和PMC算法的语音增强失真补偿方法研究[J].微电子学与计算机,2011,28(6):160-162.
10韩丹.基于谱减法的内话系统语音增强技术[J].中国民航大学学报,2011,29(4):31-34. 被引量：2

同被引文献54

1卢艳军,陈雨荻,张晓东,张太宁.基于扩展Kalman滤波的姿态信息融合方法研究[J].仪器仪表学报,2020,41(9):281-288. 被引量：39
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：62
3邵兵,杜鹏飞.基于卷积神经网络的语音情感识别方法[J].科技创新导报,2016,13(6):87-90. 被引量：6
4田熙燕,徐君鹏,杜留锋.基于语谱图和卷积神经网络的语音情感识别[J].河南科技学院学报（自然科学版）,2017,45(2):62-68. 被引量：8
5杨喜军,程慧,张涛.大长径比固体发动机侵蚀燃烧影响研究[J].战术导弹技术,2018(2):102-106. 被引量：3
6唐贤伦,杜一铭,刘雨微,李佳歆,马艺玮.基于条件深度卷积生成对抗网络的图像识别方法[J].自动化学报,2018,44(5):855-864. 被引量：143
7张若凡,黄俊,古来,许二敏,古智星.基于语谱图的老年人语音情感识别方法[J].软件导刊,2018,17(9):28-31. 被引量：3
8曾润华,张树群.改进卷积神经网络的语音情感识别方法[J].应用科学学报,2018,36(5):837-844. 被引量：12
9孙耀杰,蔡昱,张馨,薛绪掌,郑文刚,乔晓军.基于WDNN的温室多特征数据融合方法研究[J].农业机械学报,2019,50(2):273-280. 被引量：15
10贾晨,刘华平,续欣莹,孙富春.基于宽度学习方法的多模态信息融合[J].智能系统学报,2019,14(1):150-157. 被引量：19

引证文献5

1乔栋,陈章进,邓良,屠程力.基于改进语音处理的卷积神经网络中文语音情感识别方法[J].计算机工程,2022,48(2):281-290. 被引量：14
2焦亚萌,周成智,李文萍,崔琳,董免.融合多头注意力的VGGNet语音情感识别研究[J].国外电子测量技术,2022,41(1):63-69. 被引量：11
3郭保收.基于GAN的广播通讯过程多链路信息融合方法[J].信息技术,2023,47(3):70-74.
4杨慧欣,项子健,李响,滕英元.基于DCNN和数据增强的固体发动机烧蚀预示方法[J].测控技术,2023,42(8):64-70.
5胡嘉欣,田军.基于生成对抗网络的数字音频信号多声道增强方法[J].现代电子技术,2023,46(19):41-44. 被引量：2

二级引证文献26

1孙俊东,刘喜,佘长超,刘思哲,王兆飞,于洋.基于IFA-CNN的新能源矿卡锂离子电池健康状态估算[J].煤炭工程,2023,55(S01):162-168.
2张晋婧,刘双峰,丰雷,张瑜.融合注意力机制的人脸识别算法研究[J].国外电子测量技术,2023,42(2):107-113. 被引量：7
3张会云,黄鹤鸣.基于异构并行神经网络的语音情感识别[J].计算机工程,2022,48(4):113-118. 被引量：9
4朱海艳,张付春,季跃龙,李盟,王百洋.基于神经网络的脑电信号体质检测研究[J].数字印刷,2022(6):53-63. 被引量：1
5梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68. 被引量：1
6崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：4
7闫超,贾振堂.基于Transformer与增强信息融合的双源情感识别[J].国外电子测量技术,2023,42(4):187-193. 被引量：3
8郭艳霞,金勇,唐宏,彭金枝.基于动态卷积与残差门控的多模态情感识别[J].计算机工程,2023,49(7):94-101. 被引量：1
9任倩,王博.基于人机交互的心理健康监测数据异常标记识别研究[J].自动化与仪器仪表,2023(7):182-186.
10李可.面向语言对话场景的智能语音交互关键技术研究[J].自动化与仪器仪表,2023(8):295-299. 被引量：1

1许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
2熊兴隆,冯磊,刘佳,马愈昭.基于改进变分模态分解的Ф-OTDR信号去噪方法[J].半导体光电,2020,41(3):400-405. 被引量：5
3农好银.浅析拓展训练在初中体育教学的应用[J].中学生作文指导,2020(28):0163-0163.
4阳灵燕,张红燕,陈玉峰,刘亚文.机器学习在农作物品种识别中的应用研究进展[J].中国农学通报,2020,36(30):158-164. 被引量：9
5张震,李浩方,李孟州.YOLO算法在安检异常图像中的研究[J].计算机工程与应用,2020,56(21):187-193. 被引量：7
6劳海军,雷小平,张家龙,韩俊.钢闸门重量估算公式研究与探讨[J].水利科技与经济,2020,26(10):15-18. 被引量：2
7汤学兵,吴磊,李峰波.城市化、社会网络与农民工自雇创业:以平邑县油篓村为例[J].产经评论,2020,11(5):89-103. 被引量：7
8崔小曼,于凤芹.基于条件生成对抗网络的多风格素描-照片生成[J].激光与光电子学进展,2020,57(18):189-195. 被引量：1
9夏前亮,刘敬勇,冯媛,邵赛艳,钟雪燕,李勇.声表面波三工器网络合成研究[J].测控技术,2020,39(10):108-113.
10黄健,杨旭,陈先中.基于故障相关慢特征分析的过程监测方法[J].高校化学工程学报,2020,34(5):1290-1296. 被引量：3

电子技术应用

2020年第11期

浏览历史

内容加载中请稍等...

基于生成对抗网络合成噪声的语音增强方法研究被引量：5

参考文献2

二级参考文献29

共引文献25

同被引文献54

引证文献5

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络合成噪声的语音增强方法研究 被引量：5

参考文献2

二级参考文献29

共引文献25

同被引文献54

引证文献5

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络合成噪声的语音增强方法研究被引量：5