基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究

SPEECH ENHANCEMENT BASED ON DEEP FULLY CONVOLUTIONAL NEURAL ELASTIC NETWORK WCGAN-GP MODEL

下载PDF

导出

摘要 Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成深度全卷积神经网络(Deep Fully Convolutional Neural Networks,DFCNN)结构,提出一种基于DFCNN的弹性网络条件梯度惩罚(Wasserstein Conditional Generative Adversal Network Gradient Penalty,WCGAN-GP)模型。改进后的模型可以达到真实Lipschitz限制条件,提高了可控性、稳定性和特征提取能力,能更快优化训练。实验将改进后的模型与WGAN对不同噪声条件下的语音进行增强,结果证实了改进后的模型在语音增强方面的优越性。 Wasserstein generative adversal network(WGAN)model has been widely used in speech enhancement,but WGAN has problems such as gradient explosion and unstable performance.This paper introduced gradient penalty(GP)and elastic network condition constraints,and optimized the generator and discriminator into deep fully convolutional neural networks(DFCNN)structure,and proposed a kind of Wasserstein conditional gradient penalty generative adversal Elastic network(WCGAN-GP)model based on DFCNN.The improved model could reach the real Lipschitz constraints,improve the controllability,stability and feature extraction capabilities,and optimize training faster.The experiment enhanced the speech under different noise conditions with the improved model and WGAN.The results verify the superiority of the improved model in speech enhancement.

作者许雯婷龚晓峰 Xu Wenting;Gong Xiaofeng(College of Electrical Engineering,Sichuan University,Chengdu 610065,Sichuan,China)

机构地区四川大学电气工程学院

出处《计算机应用与软件》北大核心 2024年第2期130-137,共8页 Computer Applications and Software

基金四川省重点研发计划项目(2020YFG0051) 国家自然科学基金项目(61876114) 校企合作项目(19H1121,19H0355)。

关键词 Wasserstein距离深度全卷积神经网络梯度惩罚弹性网络条件约束 Wasserstein distance Deep fully convolutional neural networks Gradient penalty Elastic networks Conditional constraints

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献2

1孙成立,王海武.生成式对抗网络在语音增强方面的研究[J].计算机技术与发展,2019,29(2):152-156. 被引量：5
2曹洁,周尧风,于泓,李晓旭.基于SI-SDR优化的生成对抗网络语音增强方法[J].华中科技大学学报（自然科学版）,2020,48(11):17-23. 被引量：5

二级参考文献8

1陈欢,邱晓晖.改进谱减法语音增强算法的研究[J].计算机技术与发展,2014,24(4):69-71. 被引量：13
2郝东,荣智海,周涛.Zero-determinant strategy:An underway revolution in game theory[J].Chinese Physics B,2014,23(7):164-170. 被引量：2
3曲建岭,杜辰飞,邸亚洲,高峰,郭超然.深度自动编码器的研究与展望[J].计算机与现代化,2014(8):128-134. 被引量：40
4黄毅,段修生,孙世宇,郎巍.基于改进sigmoid激活函数的深度神经网络训练算法研究[J].计算机测量与控制,2017,25(2):126-129. 被引量：28
5王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：305
6袁文浩,娄迎曦,梁春燕,夏斌.利用生成噪声提高语音增强方法的泛化能力[J].电子学报,2019,47(4):791-797. 被引量：5
7时文华,张雄伟,邹霞,孙蒙,李莉.联合深度编解码网络和时频掩蔽估计的单通道语音增强[J].声学学报,2020,45(3):299-307. 被引量：11
8蓝天,彭川,李森,叶文政,李萌,惠国强,吕忆蓝,钱宇欣,刘峤.单声道语音降噪与去混响研究综述[J].计算机研究与发展,2020,57(5):928-953. 被引量：16

共引文献8

1许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
2向亚丽,颜冰.基于GSC的改进生成对抗网络噪声干扰抵消算法[J].武汉理工大学学报,2020,42(7):83-91. 被引量：2
3李敏,刘冰清,彭庆龙,于淼.基于CycleGAN算法的迷彩服装图案设计方法研究[J].丝绸,2022,59(8):100-106. 被引量：4
4郭保收.基于GAN的广播通讯过程多链路信息融合方法[J].信息技术,2023,47(3):70-74.
5李如玮,李秋艳,赵丰年,刘尚枫.基于注意力和深度学习的双耳语音增强算法[J].华中科技大学学报（自然科学版）,2023,51(9):125-131.
6许春冬,朱诚,应冬文,董桂官.基于多尺度特征融合的语音频带扩展[J].华中科技大学学报（自然科学版）,2023,51(9):132-139.
7曲珍.基于频带分解的中波发射机播出信号失真故障检测方法[J].中国科技纵横,2023(24):84-86.
8丁雄.老电影音频背景噪声修复算法[J].电声技术,2024,48(1):29-31.

1赵丹,沈志远,宋子豪.面向不平衡数据集的矿井通风系统智能故障诊断[J].煤炭学报,2023,48(11):4112-4123.
2肖先勇,陈智凡,汪颖,何涛,张逢蓉.基于累积和事件段识别与改进谱聚类的锂离子电池储能系统内短路故障检测方法[J].电网技术,2024,48(2):658-667.
3戚晨曦.德国早期算法艺术斯图加特1965[J].新美术,2023,44(6):213-223.
4SU Chun,HUANG Kui.Design and pricing of maintenance service contract based on Nash non-cooperative game approach[J].Journal of Systems Engineering and Electronics,2024,35(1):118-129.
5中国农科院植保所合作创制广谱抗白叶枯和细菌性条斑病水稻基因编辑新种质[J].山东农药信息,2023(6):24-24.
6ZHAO You,HE Xing,YU JunZhi,HUANG TingWen.Distributed accelerated primal-dual neurodynamic approaches for resource allocation problem[J].Science China(Technological Sciences),2023,66(12):3639-3650.
7Zeyi LI,Pan WANG,Zixuan WANG.FlowGANAnomaly: Flow-Based Anomaly Network Intrusion Detection with Adversarial Learning[J].Chinese Journal of Electronics,2024,33(1):58-71.
8Yuxian Zhang,Yi Han,Deyang Liu,Xiao Dong.Low-carbon Economic Dispatch of Electricity-Heat-Gas Integrated Energy Systems Based on Deep Reinforcement Learning[J].Journal of Modern Power Systems and Clean Energy,2023,11(6):1827-1841. 被引量：1

计算机应用与软件

2024年第2期

浏览历史

内容加载中请稍等...

基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究

参考文献2

二级参考文献8

共引文献8

相关作者

相关机构

相关主题

浏览历史