改进的稀疏字典学习单通道语音增强算法被引量：12

An Improved Monaural Speech Enhancement Algorithm Based on Sparse Dictionary Learning

下载PDF

导出

摘要基于K奇异值分解字典学习方法及其非负约束下的修改算法,本文提出一种改进的单通道语音增强算法。该算法将噪声划分为结构化噪声和非结构化噪声两部分。首先通过稀疏字典学习的方法对结构化噪声进行建模,训练出噪声字典;然后,使用所得噪声字典去除带噪语音中的结构化噪声;最后,采用过完备字典和稀疏表示的方法对纯净语音进行提取,去除非结构化噪声。实验结果表明,在平稳或非平稳噪声环境下,本文算法均能有效去除加性噪声,性能优于多带谱减法和基于非负稀疏编码的增强算法。 This paper applies the K-Singular Value Decomposition method and its non-negative variant to enhance the contaminated speech. In the proposed approach, noise is categorized as structured and unstructured noise. Firstly, the noise dictionary is learned from a training noise database. Then, we remove the structured noise iteratively by using the noise dictionary. Finally, the approach adopts sparse and redundant representations over trained dictionary to separate the clean speech from the unstructured noise. Extensive experimental results show that the enhancement method proposed out- performs state-of-the-art methods like muhi-band spectral subtraction and the non-negative sparse coding based noise reduc- tion algorithm.

作者李轶南张雄伟曾理黄建军

机构地区解放军理工大学指挥信息系统学院

出处《信号处理》 CSCD 北大核心 2014年第1期44-50,共7页 Journal of Signal Processing

基金江苏省自然科学基金(BK2012510)

关键词语音增强字典学习过完备字典稀疏表示 Speech enhancement Dictionary learning Over-complete dictionary Sparse representation

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献13

1Michal Aharon,Michael Elad,Alfred M.Bruckstein. The K-SVD:An algorithm for designing of overcomplete dictionaries for sparse and representation[J].{H}IEEE Transactions on Signal Processing,2006,(11):4311-4322.
2P.O.Hoyer. Non-negative sparse coding[A].2002.557-565.
3Elad M,Aharon M. Image denoising via sparse and redundant representations over learned dictionaries[J].{H}IEEE Transactions on Image Processing,2006,(12):3736-3745.
4Benesty J,Makino S,Chen J. Speech enhancement[M].Berlin Germany:Springer,2005.
5Christian D.Sigg,Tomas Dikk,Joachim M.Buhmann. Speech enhancement with sparse coding in learned dictionaries[A].2010.4758-4761.
6Christian D.Sigg,Tomas Dikk,Joachim M.Buhmann. Speech enhancement using generative dictionary Learning[J].IEEE Transactions on audio speech and language processing,2012,(06):1698-1712.
7Michal Aharon,Michael Elad,Alfred M. K-SVD and its Non-Negative Variant for Dictionary Design[A].SPIE,Belingham,WA,2005.
8Kristian Timm Andersen. Wind Noise Reduction in Single Channel Speech Signals[D].Technical University of Demark,2008.
9P.O.Hoyer. Non-negative matrix factorization with sparse constraints[J].{H}JOURNAL OF MACHINE LEARNING RESEARCH,2004.1457-1469.
10K.Wilson,B.Raj,P.Smaragdis,A.Divakaran. Speech denoising using nonnegative matrix factorization with priors[A].2008.4029-4032.

二级参考文献15

1Benesty J,Makino S,Chen J.Speech enhancement[M].Berlin,Germany:Springer,2005.
2Hao J C,Attias H,Nagarajan S,Lee T W,Sejnowski T J.Speech enhancement,gain,and noise spectrum adaptation using approximate bayesian estimation[J].IEEE Transactions on Audio,Speech,and Language Processing,2009,17(1):24-37.
3Yoshioka T,Nakatani T,Okuno H G.Noisy speech enhancement based on prior knowledge about spectral envelope and harmonic structure[A].2010 IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP)[C],2010:4270-4273.
4Tantibundhit C,Pernkopf F,Kubin G.Joint time-frequency segmentation algorithm for transient speech decomposition and speech enhancement[J].IEEE Transactions on Audio,Speech,and Language Processing,2010,18(6):1417-1428.
5Mallat S,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41:3397-3415.
6Gowreesunker B V,Tewfik A H.Learning sparse representation using iterative subspace identification[J].IEEE Transactions on Signal Processing,2010,58 (6):3055-3065.
7Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.
8Donoho D,Johnstone I M.Ideal spatial adaptation by wavelet shrinkage[J].Biomet rika,1994,81(3):425-455.
9Chen S S,Donoho D L,and Saunders M A.Atomic decomposition by basis pursuit[J].SIAM Review,2001,43(1):129-159.
10Griffin A,Tsakalides P.Compressed sensing of audio signals using multiple sensors[A].in Proc.16th European Signal Processing Conference (EUSIPCO'08)[C],Lausanne,Switzerland,2008.

共引文献13

1叶蕾,杨震,孙林慧,郭海燕.行阶梯观测矩阵下语音压缩感知观测序列的Volterra+Wiener模型研究[J].信号处理,2013,29(7):816-822. 被引量：3
2胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报（自然科学版）,2015,16(1):1-6. 被引量：2
3杨爱萍,田玉针,何宇清,董翠翠.基于改进K-SVD和非局部正则化的图像去噪[J].计算机工程,2015,41(5):249-253. 被引量：10
4崔晓.自训练过完备字典和稀疏表示的语音增强[J].现代电子技术,2015,38(13):56-58. 被引量：3
5靳立燕,陈莉,樊泰亭,高晶.基于奇异谱分析和维纳滤波的语音去噪算法[J].计算机应用,2015,35(8):2336-2340. 被引量：12
6周伟栋,杨震,于云.改进的正交匹配追踪语音增强算法[J].信号处理,2016,32(3):287-295. 被引量：8
7赵红玉,李小勇,何军政.压缩感知应用于透地无线通信初探[J].内蒙古科技与经济,2016(11):110-111.
8郭欣,贾海蓉,王栋.利用子空间改进的K-SVD语音增强算法[J].西安电子科技大学学报,2016,43(6):109-115. 被引量：4
9周伟力,贺前华,王亚楼,庞文丰.基于自适应逼近残差的稀疏表示语音降噪方法[J].电子与信息学报,2017,39(2):309-315. 被引量：4
10胡杰,乔建华.基于NPEC-OMP的语音增强算法[J].太原科技大学学报,2017,38(5):342-348. 被引量：1

同被引文献60

1王水平,唐振民,陈北京,蒋晔.复杂环境下语音增强的复平面谱减法[J].南京理工大学学报,2013,37(6):857-862. 被引量：6
2刘维湘,郑南宁,游屈波.非负矩阵分解及其在模式识别中的应用[J].科学通报,2006,51(3):241-250. 被引量：38
3张雄伟,等.现代语音处理技术及应用[M].北京:机械丁业出版社,2009.
4LI W F, ZHOU Y, POH N, et al. Feature denoising using joint sparse representation for in-car speech recognition [J]. IEEE Signal Processing Letters, 2013, 20(7): 681-684.
5SIGG C, DIKK T, BUHMANN J M. Speech enhancement using generative dictionary learning [J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(6): 1698-1712.
6TROPP J, GILBERT A. Signal recovery from random measure- ments via orthogonal matching pursuit [J]. Transactions on In- formation Theory, 2007, 53(12): 4655-4666.
7AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algo- rithm for designing overcomplete dictionaries for sparse repre- sentation [J]. IEEE Transactions on Signal Processing, 2006, 54(11), 4311-4322.
8Loizou P C. Speech Enhancement: Theory and Practice [ M ]. Signal Processing and Communications, 2007.
9Boll S. Suppression of acoustic noise in speech using spec- tral subtraction [ J ]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1979, 27(2) :113-120.
10Hung Wei Tseng, Srikanth Vishnubhotla, et al. A novel single channel speech enhancement approach by combi- ning wiener filter and dictionary learning [ C ]//Vancou- ver: Acoustics, Speech and Signal Process ( ICASSP), IEEE, 2013:8653-8657.

引证文献12

1崔晓.自训练过完备字典和稀疏表示的语音增强[J].现代电子技术,2015,38(13):56-58. 被引量：3
2胡永刚,张雄伟,邹霞,闵刚,郑云飞,李莉,石佳佳.改进的非负矩阵分解语音增强算法[J].信号处理,2015,31(9):1117-1123. 被引量：7
3陆真,裴东兴.基于连续小波阈值函数的语音增强技术[J].山西电子技术,2016(1):40-42. 被引量：1
4张青,吴进.基于多窗谱估计的改进维纳滤波语音增强[J].计算机应用与软件,2017,34(3):67-70. 被引量：11
5张雄伟,李轶南,时文华,胡永刚,陈栩杉.非负组合模型及其在声源分离中的应用[J].数据采集与处理,2017,32(2):266-277. 被引量：2
6滕少华,宋欢,霍颖翔,张巍.一种增量式学习的语音字典构造方法[J].广东工业大学学报,2018,35(3):29-36. 被引量：1
7武正平,马建芬,张朝霞,杨东东.改进的正交匹配追踪的语音增强算法[J].应用声学,2018,37(6):934-939. 被引量：1
8时文华,张雄伟,邹霞,孙蒙.利用深度全卷积编解码网络的单通道语音增强[J].信号处理,2019,35(4):631-640. 被引量：5
9孙林慧,吴子皓,谢可丽,李平安.基于双层字典学习的单通道语音增强方法[J].信号处理,2020,36(6):1001-1012. 被引量：1
10余赈,马建芬.基于共轭梯度法改进的正交匹配追踪语音增强算法[J].武汉理工大学学报,2021,43(8):97-104.

二级引证文献40

1周岩,王雪瑞.基于差分演化-MP的快速信号稀疏分解[J].洛阳理工学院学报（自然科学版）,2016,26(1):64-69.
2王雪瑞,周岩.基于差分演化-MP的快速信号稀疏分解[J].商丘师范学院学报,2016,32(12):45-49.
3肖楠,李健,肖启阳.采用SVD-NMF的管道泄漏信号去噪算法[J].传感技术学报,2017,30(1):101-108. 被引量：3
4曹建凯,张连海.采用HDPHMM符号化器的语音查询样例检测方法[J].信号处理,2017,33(5):703-710. 被引量：1
5李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
6郑永敏,鲍鸿,张晶.基于维纳–小波分析的语音去噪新方法[J].广东工业大学学报,2017,34(5):52-55. 被引量：1
7胡杰,乔建华.基于NPEC-OMP的语音增强算法[J].太原科技大学学报,2017,38(5):342-348. 被引量：1
8张雄伟,李轶南,郑昌艳,曹铁勇,孙蒙,闵刚.语音去混响技术的研究进展与展望[J].数据采集与处理,2017,32(6):1069-1081. 被引量：6
9韩素青,贾茹.基于稀疏约束非负矩阵分解的K-Means聚类算法[J].数据采集与处理,2017,32(6):1216-1222. 被引量：8
10都格草,才让卓玛,南措吉.基于谱减法的藏语语音减噪研究[J].广西科学院学报,2018,34(1):78-82. 被引量：2

1陈玉霞.三种经典单通道语音增强算法的比较[J].福建商业高等专科学校学报,2014(5):100-104. 被引量：2
2马建芬,李鸿燕,张雪英,王华奎.盲源分离在单通道语音增强算法中的应用[J].计算机应用,2006,26(11):2694-2695. 被引量：3
3李鸿燕,赵菊敏,王华奎,萧宝瑾.基于独立分量分析的单通道语音增强算法[J].计算机工程,2007,33(24):35-36. 被引量：7
4叶利剑.通信系统中语音编解码对语音增强算法的影响[J].电声技术,2011,35(10):68-74. 被引量：1
5黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
6陈国明,赵力,邹采荣.一种基于短时谱估计和人耳掩蔽效应的语音增强算法[J].电子与信息学报,2007,29(4):863-866. 被引量：4
7李轶南,张雄伟,贾冲,陈亮,曾理.稀疏低秩噪声模型下无监督实时单通道语音增强算法[J].声学学报,2015,40(4):607-614. 被引量：8
8杨龙.几种单通道的语音增强算法研究[J].科技视界,2015(26):155-155. 被引量：2
9贾海蓉,张雪英,贾丽红.改进最大信噪比的独立成分分析单通道语音增强算法[J].北京理工大学学报,2013,33(2):198-202. 被引量：3
10TAN JianDong,WANG Qi,WANG ZhaoCheng.Modified PTS-based PAPR reduction for ACO-OFDM in visible light communications[J].Science China Chemistry,2015,58(12):210-212.

信号处理

2014年第1期

浏览历史

内容加载中请稍等...

改进的稀疏字典学习单通道语音增强算法被引量：12

参考文献13

二级参考文献15

共引文献13

同被引文献60

引证文献12

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

改进的稀疏字典学习单通道语音增强算法 被引量：12

参考文献13

二级参考文献15

共引文献13

同被引文献60

引证文献12

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

改进的稀疏字典学习单通道语音增强算法被引量：12