联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法被引量：11

A Research to Speech Dereverberation Method Based on BLSTM Recurrent Neural Networks and Non-negative Matrix Factorization

下载PDF

导出

摘要本文提出了一种联合长短时记忆递归神经网络和非负矩阵分解方法对单通道语音进行混响消除;对语音信号的对数功率谱建模抑制混响干扰。首先通过长短时记忆递归神经网络估计对数功率谱,这种模型结构能捕获整个音频序列的信息重构纯净语音的对数功率谱,然后通过非负矩阵分解方法对重构的对数功率谱进行后处理抑制过平滑问题;实验结果表明所提方法可以有效抑制语音信号中的混响干扰,本文方法的各种性能指标优于基线方法。 This paper presents a two stages speech dereverberation method which combine the bidirectional Long Short Term Memory（ BLSTM） recurrent neural network with non-negative matrix factorization（ NMF） for a single channel. The log power spectra is selected as features to suppress the reverberation. The BLSTM-RNN which can capture information from anywhere in the feature sequence is used to dereverberated log power spectra firstly and NMF which could alleviate the oversmoothing problem is applied to generated log power spectra in the second stage. Experimental results demonstrate that the proposed method could achieve significant improvements over the different baseline methods.

作者刘斌陶建华

机构地区中国科学院自动化研究所模式识别国家重点实验室中国科学院脑科学与智能技术卓越创新中心中国科学院大学计算机与控制学院

出处《信号处理》 CSCD 北大核心 2017年第3期268-272,共5页 Journal of Signal Processing

基金中国国家高技术研究发展计划(863计划)(2015AA016305) 国家自然科学基金(61425017 61403386 61305003 61233009 61273288) 国家社会科学基金重大项目(13&ZD189) 中国科学院先导专项(Grant XDB02080006)

关键词单通道混响消除长短时记忆递归神经网络非负矩阵分解深度学习 single channel based dereverberation long short term memory recurrent neural network nonnegative matrix factorization deep learning

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献78

1唐艳慧,赵鹏,王承琨.基于多重分形谱的木材高光谱图像纹理分类算法[J].液晶与显示,2019,34(12):1182-1190. 被引量：11
2刘星亮,邱祁,王若宇,邓焰,何湘宁.基于有限元仿真的高频高压变压器分段绕组漏感设计方法[J].高电压技术,2020,46(2):610-617. 被引量：8
3张汝波,刘冠群,吴俊伟,吕西宝.移动机器人语音控制技术研究与实现[J].华中科技大学学报（自然科学版）,2013,41(S1):348-351. 被引量：8
4周阿娟,郭相科,谢瑶.基于小波包分解的声目标识别[J].空军工程大学学报（自然科学版）,2007,8(6):40-43. 被引量：4
5翟永杰,王静娴,周黎辉.基于模糊支持向量机的电力系统中期负荷预测[J].华北电力大学学报（自然科学版）,2008,35(2):70-73. 被引量：12
6张金艳,郭鹏江.确定性时间序列模型及ARIMA模型的应用[J].西安邮电学院学报,2009,14(3):128-132. 被引量：8
7李秀坤,谢磊,秦宇.应用希尔伯特黄变换的水下目标特征提取[J].哈尔滨工程大学学报,2009,30(5):542-546. 被引量：19
8戴卫国,程玉胜,王易川.支持向量机对舰船噪声DEMON谱的分类识别[J].应用声学,2010,29(3):206-211. 被引量：10
9杨险峰,黄强.超光滑表面非接触测量方法研究[J].机械设计与制造,2011(2):211-212. 被引量：1
10李钊年,陶凤玲,史旺旺,姜楠,李积花,倪三川.基于谱分析与LS-SVM的中期电力负荷预测[J].电力系统保护与控制,2011,39(9):88-90. 被引量：6

引证文献11

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：15
2张朝蓓,夏鹏杰.基于矩阵分解的扼流适配变压器绕组漏磁检测[J].无损检测,2022,44(6):40-44.
3罗欣,张爽,景伟强,朱蕊倩,魏骁雄,陈博,葛岳军.LSTM深度学习在短期95598话务工单异动预警中的应用[J].浙江电力,2018,37(12):38-44. 被引量：2
4张星.改进NMF单通道语音增强算法[J].机械设计与制造,2019(1):268-271. 被引量：1
5范存航,刘斌,陶建华,温正棋,易江燕.一种基于卷积神经网络的端到端语音分离方法[J].信号处理,2019,35(4):542-548. 被引量：13
6徐及,黄兆琼,李琛,颜永红.深度学习在水下目标被动识别中的应用进展[J].信号处理,2019,35(9):1460-1475. 被引量：17
7刘江永,刘文翰,易灵芝.多时序协同中期负荷预测模型[J].电力系统及其自动化学报,2020,32(2):48-53. 被引量：14
8蓝天,彭川,李森,叶文政,李萌,惠国强,吕忆蓝,钱宇欣,刘峤.单声道语音降噪与去混响研究综述[J].计算机研究与发展,2020,57(5):928-953. 被引量：17
9贾海蓉,梅淑琳,张敏.基于双通道神经网络时频掩蔽的语音增强算法[J].华中科技大学学报（自然科学版）,2021,49(6):43-49. 被引量：6
10全海燕,王涛,郑志清.加性频域分解的生成对抗网络语音去混响[J].工程科学与技术,2022,54(2):180-187.

二级引证文献91

1刘元,匡文凯,苏盛,李彬.基于双通道能量差的环网柜局放信号消噪方法[J].仪器仪表学报,2021,42(2):218-227. 被引量：6
2卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
3庞铄,罗政纯,王忠民,常天英,代广斌,于淼,吴崇坚,崔洪亮.用于海洋水位监测的干涉式光纤水位传感系统[J].光子学报,2019,48(9):67-74. 被引量：9
4李江,冯存前,王义哲,许旭光.基于AlexNet-BiLSTM网络的锥体目标微动分类[J].信号处理,2019,35(11):1835-1843. 被引量：4
5王小宇,李凡,曹琳,李军,张驰,彭圆,丛丰裕.改进的卷积神经网络实现端到端的水下目标自动识别[J].信号处理,2020,36(6):958-965. 被引量：9
6王涛,全海燕.基于生成对抗网络联合训练的语音分离方法[J].信号处理,2020,36(6):1013-1019. 被引量：3
7陈修凯,陆志华,周宇.基于卷积编解码器和门控循环单元的语音分离算法[J].计算机应用,2020,40(7):2137-2141. 被引量：7
8祁晓,赵连玉.基于多频带谱减法的老年人语音增强算法的研究[J].电声技术,2020,44(5):34-37.
9易灵芝,张宗光,范朝冬,罗显光,李旺,刘文翰.基于EEMD-GSGRU的锂电池寿命预测[J].储能科学与技术,2020,9(5):1566-1573. 被引量：7
10王玉萍,王祥,朱刚毅,吴希田,李林,安平.基于大数据的电力市场人工智能客服支持平台设计[J].自动化与仪器仪表,2020(9):136-138.

1李成秋.记忆的奥秘[J].科学24小时,2009(1):17-18.
2李旭.“工作记忆”的秘密[J].百科知识,2012(10):31-32.
3张海锋,胡春海.压缩感知重构的传感器目标定位研究[J].激光杂志,2016,37(11):128-131. 被引量：4
4夏雪.关于西汉同声传译的一点心得体会[J].科技信息,2013(16):201-202.
5张乐,梁宁建.不同背景噪音干扰下的数字短时记忆研究[J].心理科学,2006,29(4):789-794. 被引量：11
6邓峰,钱扬义.记忆编码在高中化学教学中的应用举例[J].化学教学,2006(2):15-16. 被引量：8
7司伟建,万良田,刘鲁涛,田作喜,蓝晓宇.共形阵列天线超宽频带波达方向实时估计[J].哈尔滨工程大学学报,2014,35(7):913-918. 被引量：5
8邓亮,李斌,王强,郑珍.三维编队飞行短时记忆控制[J].现代电子技术,2011,34(5):5-8. 被引量：1
9杨悦民.用单片机实现语音信号的存放[J].镇江市高等专科学校学报,1998,11(4):70-72.
10刘桂强,杨冠玲,岳成凤,何振江,周述苍,喻雷寿.纳米颗粒光子相关测定中基线方法对测量结果的影响[J].光子学报,2008,37(2):370-374. 被引量：3

信号处理

2017年第3期

浏览历史

内容加载中请稍等...

联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法被引量：11

同被引文献78

引证文献11

二级引证文献91

相关作者

相关机构

相关主题

浏览历史

联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法 被引量：11

同被引文献78

引证文献11

二级引证文献91

相关作者

相关机构

相关主题

浏览历史

联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法被引量：11