ADMM稀疏非负矩阵分解语音增强算法被引量：2

Speech enhancement algorithm using ADMM sparse nonnegative matrix factorization

下载PDF

导出

摘要提出一种基于交替方向乘子法的(Alternating Direction Method of Multipliers,ADMM)稀疏非负矩阵分解语音增强算法,该算法既能克服经典非负矩阵分解(Nonnegative Matrix Factorization,NMF)语音增强算法存在收敛速度慢、易陷入局部最优等问题,也能发挥ADMM分解矩阵具有的强稀疏性。算法分为训练和增强两个阶段:训练时,采用基于ADMM非负矩阵分解算法对噪声频谱进行训练,提取噪声字典,保存其作为增强阶段的先验信息;增强时,通过稀疏非负矩阵分解算法,从带噪语音频谱中对语音字典和语音编码进行估计,重构原始干净的语音,实现语音增强。实验表明,该算法速度更快,增强后语音的失真更小,尤其在瞬时噪声环境下效果显著。 This paper proposes a speech enhancement algorithm putting the theory of Alternating Direction Method of Multipliers（ADMM） into the algorithm of sparse nonnegative matrix factorization, which can solve the problems such as slow convergence and poor local optima in the traditional speech enhancement based Nonnegative Matrix Factorization（NMF）. It mainly consists of a training stage and an enhancement stage. During the training stage, the dictionaries of the noise are constructed as the prior information by using the ADMM based nonnegative matrix factorization. In the enhancement stage, the spectrum of noisy speech is analyzed by the sparse normegative matrix factorization algorithm. After that, the noise dictionary is combined with iterative formulation to evaluate the speech dictionary and the coding matrix of speech. The clean part of the speech is finally reconstructed from the noisy speech. Compared with the traditional speech enhancement methods of NMF, extensive experiments indicate that this algorithm not only has faster speed but also gets better noise suppression performance especially under instantaneous noise environment.

作者胡永刚张雄伟邹霞闵刚张立伟王健

机构地区解放军理工大学指挥信息系统学院西安通信学院解放军九三七三厂

出处《计算机工程与应用》 CSCD 北大核心 2016年第3期108-112,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61471394) 江苏省自然科学青年基金(No.Bk20140074)

关键词语音增强稀疏非负矩阵分解交替方向乘子法 speech enhancement sparse nonnegative matrix factorization alternating direction method of multipliers

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献18

1张雄伟,等.现代语音处理技术及应用[M].北京:机械丁业出版社,2009.
2So S,Paliwal K K.Suppressing the influence of additive noise on the Kalman gain for low residual noise speech enhancement[J].Speech Communication,2011,53(3):355-378.
3Paliwal K,Wokcicki K,Schwerin B.Single channel speech enhancement using spectral subtraction in the short time modulation domain[J].Speech Communication,2010,52(5):450-475.
4邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
5Mohammadiha N,Taghia J,Leijon A.Single channel speech enhancement using Bayesian NMF with recursive temporal updates of prior distributions[C]//Acoustics,Speech and Signal Process(ICASSP),2012:4561-4564.
6Xu Y,Du J,Lee L C H.An experimental study on speech enhancement based on deep neural networks[J].IEEE Signal Processing Letters,2014,21(1):65-68.
7Civier O,Tasko S M,Guenther F H.Overreliance on auditory feedback may lead to sound/syllable repetitions:simulations of stuttering and fluency-inducing conditions with a neural model of speech production[J].Journal of Fluency Disorders,2010,35(3):246-279.
8Lee D D,Seung H S.Learning the parts of objects by non-negative matrix factorization[J].Nature,1999,401(10):788-791.
9黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
10张立伟,贾冲,张雄伟,闵刚,曾理.稀疏卷积非负矩阵分解的语音增强算法[J].数据采集与处理,2014,29(2):259-264. 被引量：13

二级参考文献83

1邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
2EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1984,32(6):1109-1121.
3EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error log-spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1985,33(2):443-445.
4SOON I Y,KOH S N,YEO C K.Noisy speech enhancement using discrete cosine transform[J].Speech Communication,1998,24(3):249-257.
5GAZOR S,ZHANG W.Speech probability distribution[J].IEEE Signal Processing Letters,2003,10(7):204-207.
6MARTIN R.Statistical methods for the enhancement of noisy speech[A].IWAENC'2003[C].2003.1-6.
7MARTIN R.Speech enhancement using MMSE short time spectral estimation with Gamma distributed speech priors[A].ICASSP'2002[C].2002.253-256.
8MARTIN R,BREITHAUPT C.Speech enhancement in the DFT domain using Laplacian speech priors[A].IWAENC'2003[C].2003.87-90.
9BREITHAUPT C,MARTIN R.MMSE estimation of magnitudesquared DFT coefficients with supergaussian priors[A].ICASSP'2003[C].2003.896-899.
10CHEN B,LOIZOU P C.Speech enhancement using a MMSE short time spectral amplitude estimator with Laplacian speech modeling[A].ICASSP'2005[C].2005.1097-1100.

共引文献53

1Andy Ramlatchan,Mengyun Yang,Quan Liu,Min Li,Jianxin Wang,Yaohang Li.A Survey of Matrix Completion Methods for Recommendation Systems[J].Big Data Mining and Analytics,2018,1(4):308-323. 被引量：4
2黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
3赵改华,周彬,张雄伟.基于超高斯混合模型的语音幅度谱增强算法[J].通信技术,2013,46(6):137-141.
4隋璐瑛,张雄伟,黄建军,赵改华.基于码本学习的改进谱减语音增强算法[J].计算机工程与应用,2013,49(16):216-220. 被引量：3
5史加荣,郑秀云,周水生.矩阵补全算法研究进展[J].计算机科学,2014,41(4):13-20. 被引量：14
6赵改华,周彬,张雄伟.基于自适应超高斯混合模型的语音增强算法[J].数据采集与处理,2014,29(2):232-237. 被引量：2
7张立伟,贾冲,张雄伟,闵刚,曾理.稀疏卷积非负矩阵分解的语音增强算法[J].数据采集与处理,2014,29(2):259-264. 被引量：13
8Fenghui WANG,Wenfei CAO,Zongben XU.Convergence of multi-block Bregman ADMM for nonconvex composite problems[J].Science China(Information Sciences),2018,61(12):49-60. 被引量：10
9王彬福,陈晓云,肖秉森.基于低秩表示与矩阵填充的人脸识别方法[J].模式识别与人工智能,2018,31(12):1111-1119. 被引量：2
10周彬,邹霞,张雄伟.改进的噪声鲁棒语音稀疏线性预测算法[J].声学学报,2014,39(5):655-662. 被引量：1

同被引文献22

1徐明华,叶彩鸿,何炳生.一类资源价格调控的数学模型和它的求解方法[J].系统工程,2005,23(10):92-96. 被引量：2
2李富强,万红,黄俊杰.基于MATLAB的语谱图显示与分析[J].微计算机信息,2005,21(10X):172-174. 被引量：27
3童小娇,何炳生.一类单调变分不等式的非精确交替方向法[J].数学物理学报（A辑）,2006,26(2):273-282. 被引量：3
4罗小桂,何雁.矩阵奇异值分解在计算技术中的应用[J].计算机与现代化,2006(6):67-68. 被引量：13
5康春玉,章新华.一种基于奇异值分解的自适应降噪方法[J].声学技术,2008,27(3):455-458. 被引量：17
6赵学智,叶邦彦,陈统坚.矩阵构造对奇异值分解信号处理效果的影响[J].华南理工大学学报（自然科学版）,2008,36(9):86-93. 被引量：51
7张海英.基于夏普比率的信息检索系统性能评价方法[J].统计与决策,2008,24(20):171-172. 被引量：2
8肖纯智,孙大飞,高勇.一种基于语谱图分析的语音增强算法[J].电声技术,2012,36(9):44-48. 被引量：6
9陈欢,邱晓晖.改进谱减法语音增强算法的研究[J].计算机技术与发展,2014,24(4):69-71. 被引量：13
10袁文浩,林家骏,王雨,陈宁.一种基于噪声分类的语音增强方法[J].华东理工大学学报（自然科学版）,2014,40(2):196-201. 被引量：5

引证文献2

1李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
2刘媛媛,韦增欣,李峥嵘.最大化夏普比率的交替方向乘子法[J].广西大学学报（自然科学版）,2021,46(1):236-243.

二级引证文献1

1马龙双,许枫,刘佳,蒋立军.基于多级子空间投影的侧扫声呐底混响抑制[J].网络新媒体技术,2021,10(3):51-57.

1胡永刚,张雄伟,邹霞,闵刚,郑云飞,李莉,石佳佳.改进的非负矩阵分解语音增强算法[J].信号处理,2015,31(9):1117-1123. 被引量：7
2陈书贞,姬社平,练秋生.应用双稀疏模型和ADMM优化的图像复原[J].信号处理,2015,31(7):823-832. 被引量：1
3许然,李亚超,邢孟道.利用稀疏非负矩阵分解的大转角SAR成像方法[J].西安电子科技大学学报,2014,41(3):49-55. 被引量：2
4陈建,苏凯雄,杨秀芝,郑明魁,林丽群.基于变分模型的块压缩感知重构算法[J].通信学报,2016,37(1):100-109. 被引量：7
5李志保,戴彧虹.回响环境下的最优波束形成器设计[J].中国科学：数学,2016,46(6):877-892.
6练秋生,韩敏,石保顺,陈书贞.融合解析模型和综合模型的压缩感知算法[J].电子学报,2016,44(3):613-619. 被引量：3
7张倩.全变分高阶模型的快速去噪算法[J].电子世界,2016,0(13):165-166. 被引量：1
8练秋生,赵晓蕊,石保顺,陈书贞.基于卡通–纹理模型的相位恢复算法[J].电子与信息学报,2016,38(8):1991-1998. 被引量：1
9金正猛,杨燕.基于框式约束的快速全变差图像泊松去噪算法[J].电子与信息学报,2014,36(8):1866-1871. 被引量：3
10隋璐瑛,张雄伟,黄建军,董军涛.一种基于非负矩阵分解的语音增强算法[J].军事通信技术,2012,33(1):18-22. 被引量：2

计算机工程与应用

2016年第3期

浏览历史

内容加载中请稍等...

ADMM稀疏非负矩阵分解语音增强算法被引量：2

参考文献18

二级参考文献83

共引文献53

同被引文献22

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

ADMM稀疏非负矩阵分解语音增强算法 被引量：2

参考文献18

二级参考文献83

共引文献53

同被引文献22

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

ADMM稀疏非负矩阵分解语音增强算法被引量：2