区分性联合稀疏字典交替优化的语音增强被引量：5

Speech enhancement based on discriminative joint sparse dictionary alternate optimization

下载PDF

导出

摘要在联合稀疏字典的语音增强中,由于联合字典的相似性,导致稀疏重构阶段产生语音和噪声混淆进而产生语音失真问题。针对此,在训练阶段提出一个费希尔准则下的目标函数。该函数包含了语音和噪声的区分约束项,并用与信号变化相关的平衡因子去调整各项权值,为尽可能减小混淆误差提供了保障;同时,为了能使目标函数收敛,设计了一种交替优化字典和稀疏系数的算法,迭代寻找所需的字典和稀疏系数,完成语音字典和噪声字典的输出,得到具有非相似即区分性能较好的联合字典。在增强阶段,将带噪语音信号在联合字典上进行稀疏表示,并估计出语音幅度谱和噪声幅度谱。最后,结合维纳滤波器和理想二值掩模的优点,提出了新的软掩模滤波器,进一步消除了残余噪声。通过对不同信噪比的带噪语音进行实验,新算法得到的语音信噪比和听觉感知评价都较高,验证了新算法在提高语音性能方面的有效性。 In the speech enhancement of the joint sparse dictionary, due to the similarity of the joint dictionary, the speech and noise confusion is generated in the sparse reconstruction stage, which will generate the speech distortion problem. In view of this, an objective function under the Fisher criterion is proposed in the training stage. This function contains the distinguishing constraint of speech and noise, and adjusts the weights with the balance factor related to the signal change, so as to make the confusion error as small as possible. At the same time, in order to make the objective function converge, an algorithm is designed for alternately optimizing the dictionary and sparse coefficients. The algorithm is iterated to find the needed dictionary and sparse coefficient, and completes the output of the speech dictionary and noise dictionary. A joint dictionary with dissimilarity and good discrimination performance is obtained. In the enhancement phase, the noisy speech signal is represented sparsely in the joint dictionary, and the speech amplitude spectrum and noise amplitude spectrum are estimated. Finally, combining the advantages of the Wiener filter and ideal binary mask, a new soft mask filter is proposed. The residual noise is further eliminated. Through the experiments of noisy speech with different signal-to-noise ratios (SNR), the new algorithm has high SNR and auditory perception evaluation, which verifies the effectiveness of the new algorithm in improving speech performance.

作者贾海蓉王卫梅王雁裴俊华 JIA Hairong;WANG Weimei;WANG Yan;PEI Junhua(College of Information and Computer,Taiyuan University of Technology,Taiyuan 030024,China)

机构地区太原理工大学信息与计算机学院

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第3期74-81,共8页 Journal of Xidian University

基金国家自然科学基金(61371193) 山西省自然科学基金(201701D121058)

关键词语音增强费希尔稀疏表示交替优化软掩模滤波器 speech enhancement Fisher sparse representation alternately optimizing soft mask filter

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1郭欣,贾海蓉,王栋.利用子空间改进的K-SVD语音增强算法[J].西安电子科技大学学报,2016,43(6):109-115. 被引量：4
2桑成伟,孙洪.基于可区分性字典学习模型的极化SAR图像分类[J].信号处理,2017,33(11):1405-1415. 被引量：1
3王栋,贾海蓉.改进相位谱补偿的语音增强算法[J].西安电子科技大学学报,2017,44(3):83-88. 被引量：13

二级参考文献8

1吴永辉,计科峰,郁文贤.利用SVM的全极化、双极化与单极化SAR图像分类性能的比较[J].遥感学报,2008,12(1):46-53. 被引量：16
2高银秋,邓宗元,杨震.数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计[J].南京邮电大学学报（自然科学版）,2006,26(5):56-64. 被引量：2
3孙林慧,杨震.基于数据驱动字典和稀疏表示的语音增强[J].信号处理,2011,27(12):1793-1800. 被引量：14
4高永婵,廖桂生,朱圣棋.复合高斯噪声中知识辅助的贝叶斯Rao检测方法[J].西安电子科技大学学报,2013,40(6):46-51. 被引量：5
5杨立春,叶敏超,钱沄涛.基于多任务稀疏表达的二元麦克风小阵列话音增强算法[J].通信学报,2014,35(2):87-94. 被引量：3
6张君昌,刘海鹏,樊养余.一种自适应时移与阈值的DCT语音增强算法[J].西安电子科技大学学报,2014,41(6):155-159. 被引量：8
7容强,肖汉.基于MMSE维纳滤波语音增强方法研究与Matlab实现[J].计算机应用与软件,2015,32(1):153-156. 被引量：10
8刘璐,靳少辉,焦李成,刘帅.采用流形近邻传播聚类的极化SAR图像分类[J].信号处理,2016,32(2):135-141. 被引量：4

共引文献15

1李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
2周正仙,邹翔,袁扬胜,甘露,祝玉军.干涉型光纤语音传感器及语音降噪方法研究[J].仪器仪表学报,2017,38(11):2715-2724. 被引量：7
3朱慧敏.基于人耳掩蔽特性的语音增强数字助听器研究[J].国外电子测量技术,2018,37(5):129-132.
4李东,张雪英,段淑斐,闫密密.结合语音融合特征和随机森林的构音障碍识别[J].西安电子科技大学学报,2018,45(3):149-155. 被引量：8
5王法松.“信号与系统”课程中关于信号相位谱的分析[J].微型电脑应用,2018,34(9):1-3. 被引量：1
6吉慧芳,贾海蓉,王雁.改进相位谱补偿的语音增强方法[J].计算机工程与应用,2019,55(8):48-52. 被引量：4
7贾海蓉,王卫梅,吉慧芳.信噪比信息与时频特征修正相位的语音增强[J].西安电子科技大学学报,2019,46(5):162-170. 被引量：5
8董胡,徐雨明,马振中,李列文,任可.基于小波包与自适应维纳滤波的语音增强算法[J].计算机技术与发展,2020,30(1):50-53. 被引量：9
9许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
10张天骐,张晓艳,周琳,胡延平.基于稀疏性的相位谱补偿语音增强算法[J].信号处理,2020,36(11):1867-1876. 被引量：5

同被引文献20

1孙林慧,杨震.基于数据驱动字典和稀疏表示的语音增强[J].信号处理,2011,27(12):1793-1800. 被引量：14
2李轶南,张雄伟,曾理,黄建军.改进的稀疏字典学习单通道语音增强算法[J].信号处理,2014,30(1):44-50. 被引量：12
3刘凤山,吕钊,张超,吴小培.改进小波阈值函数的语音增强算法研究[J].信号处理,2016,32(2):203-213. 被引量：13
4刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：66
5郭欣,贾海蓉,王栋.利用子空间改进的K-SVD语音增强算法[J].西安电子科技大学学报,2016,43(6):109-115. 被引量：4
6CHEN Yanli,GUO Lianghao,GONG Zaixiao.The concise fractional Fourier transform and its application in detection and parameter estimation of the linear frequency-modulated signal[J].Chinese Journal of Acoustics,2017,36(1):70-86. 被引量：13
7徐志刚,李文文,袁飞祥,朱红蕾,许亚美.基于稀疏表示和多成分字典学习的超分辨率重建[J].系统工程与电子技术,2018,40(3):699-703. 被引量：4
8李晋,燕欢,汤井田,张贤,李广,朱会杰.基于匹配追踪和遗传算法的大地电磁噪声压制[J].地球物理学报,2018,61(7):3086-3101. 被引量：15
9王大为,王召巴.一种强噪声背景下微弱超声信号提取方法研究[J].物理学报,2018,67(21):52-64. 被引量：11
10蒋茂松,王冬霞,牛芳琳,曹玉东.稀疏正则非负矩阵分解的语音增强算法[J].计算机应用,2018,38(4):1176-1180. 被引量：6

引证文献5

1孙林慧,吴子皓,谢可丽,李平安.基于双层字典学习的单通道语音增强方法[J].信号处理,2020,36(6):1001-1012. 被引量：1
2李霞,陈军翰,王艺达.稀疏表示下的超声信号处理研究及应用[J].新型工业化,2020,10(6):70-72.
3梅淑琳,贾海蓉,王晓刚,武奕峰.动态特征联合新掩模优化神经网络语音增强[J].西安电子科技大学学报,2021,48(3):91-98.
4武瑞沁,陈雪勤,俞杰,王丽荣,赵鹤鸣.结合注意力机制的改进U-Net网络在端到端语音增强中的应用[J].声学学报,2022,47(2):266-275. 被引量：8
5WU Ruiqin,CHEN Xueqin,YU Jie,WANG Lirong,ZHAO Heming.Application of improved U-Net network with attention mechanism in end-to-end speech enhancement[J].Chinese Journal of Acoustics,2022,41(4):390-403.

二级引证文献9

1孙林慧,张蒙,梁文清.基于CNN-SVM性别组合分类的单通道语音分离[J].信号处理,2022,38(12):2519-2531.
2汪晟磊,宋星,杨彦青.智能家居语音控制系统的设计[J].自动化与仪器仪表,2023(4):117-122. 被引量：2
3李学贵,周英杰,董宏丽,吴钧,徐刚,王如意.基于双注意力U-Net网络的提高地震分辨率方法[J].石油地球物理勘探,2023,58(3):507-517. 被引量：1
4沈梦强,于文年,易黎,宋南.基于GAN的全时间尺度语音增强方法[J].计算机工程,2023,49(6):115-122. 被引量：2
5张琳,王海涛,杨爽,曾向阳,陈克安.面向舱室声学环境的深度时域语音增强网络[J].声学学报,2023,48(4):890-900.
6刘秋月,刘雪峰,孙绍华.基于阴影增强和注意力机制的高光谱图像分类[J].电子测量技术,2023,46(8):14-23.
7刘杨,杨飞然,杨军.编码器-时序建模结构的时延估计及在回声抵消中的应用[J].声学学报,2023,48(5):1036-1044.
8杨弋,胡琦,张鹏远.双路注意力循环网络的轻量化语音分离[J].声学学报,2023,48(5):1060-1069.
9高盛祥,莫尚斌,余正涛,董凌,王文君.基于多维度注意力机制和复数Conformer的单通道语音增强方法[J].重庆邮电大学学报（自然科学版）,2024,36(2):393-403.

1文仕学,孙磊,杜俊.渐进学习语音增强方法在语音识别中的应用[J].小型微型计算机系统,2018,39(1):1-6. 被引量：5
2蒲志宏,刘艳群,王红.心血管病与气象条件的关系[J].中国社区医师,2019,35(15):6-7. 被引量：3
3何建华.探究中学英语教学质量的优化[J].教学管理与教育研究,2019,4(7):54-55.
4唐文杰.成果导向的英语语音课程教学改革探析[J].湖南第一师范学院学报,2019,19(1):11-15. 被引量：4
5成晶,沈超,夏树强.上行-下行联合优化的uRLLC传输[J].中兴通讯技术,2019,25(1):47-54. 被引量：3
6王光艳,李玥玲,王新刚.基于Python的深度学习BP网络语音增强方法研究[J].信息通信,2019,32(3):58-59. 被引量：4
7季中恒,季新生,陈亚军,王继.基于天线选择的CRN下行波束赋形方案[J].高技术通讯,2019,29(4):329-337.
8朱舒雅,倪彬彬,顾旭东.基于小波变换的语音去噪阈值函数的研究[J].河北北方学院学报（自然科学版）,2017,33(9):29-33. 被引量：1
9裴俊华,贾海蓉.基于子空间域的自适应小字典的语音增强[J].现代电子技术,2019,42(1):46-50. 被引量：1
10吕恒伟,李攀东,张海剑,孙洪.多小区5G认知无线电网络能量有效资源优化[J].信号处理,2018,34(12):1440-1449. 被引量：2

西安电子科技大学学报

2019年第3期

浏览历史

内容加载中请稍等...

区分性联合稀疏字典交替优化的语音增强被引量：5

参考文献3

二级参考文献8

共引文献15

同被引文献20

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

区分性联合稀疏字典交替优化的语音增强 被引量：5

参考文献3

二级参考文献8

共引文献15

同被引文献20

引证文献5

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

区分性联合稀疏字典交替优化的语音增强被引量：5