基于隐马尔可夫模型的非监督噪声功率谱估计被引量：4

Unsupervised Noise Power Estimation Using Hidden Markov Model

下载PDF

导出

摘要噪声功率谱估计是语音增强算法的基本组成部分,传统算法大多采用启发式的估计方法,因而不能保证噪声估计值的统计最优。提出了一种基于极大似然的非监督噪声功率谱估计方法,采用隐马尔可夫模型(Hidden Markov model,HMM)在每个子带建立语音和非语音对数功率谱的统计模型,模型包含语音和非语音两个高斯分量,其中非语音高斯分量的均值表示噪声功率谱估计值,根据最大期望(Expectation maximization,EM)算法得到包括噪声均值在内的HMM参数集。针对语音信号可能出现的长时缺失,对HMM引入了一些约束条件,保证了模型的稳定性。实验表明,该方法获得的极大似然噪声估计优于基于启发式的经典方法获得的噪声估计。 Noise estimation is a fundamental part of speech enhancement.Most traditional methods are heuristic which can not enable the optimal estimation.An unsupervised noise power estimation is presented based on maximum likelihood.A log-power statistical model is constructed using hidden Markov model（HMM）in each subband.This model comprises speech and nonspeech Gauss components,and the mean value of nonspeech Gauss component is the estimation of noise power.Moreover,speech may be long-term absent,some constraints are introduced to this model for stability.The experiments validate that the proposed method can obtain the maximum likelihood noise estimation and outperforms conventional heuristic methods.

作者许春冬战鸽应冬文李军锋颜永红

机构地区中国科学院声学研究所语言声学与内容理解重点实验室江西理工大学信息工程学院北京理工大学信息与电子学院

出处《数据采集与处理》 CSCD 北大核心 2015年第2期359-364,共6页 Journal of Data Acquisition and Processing

基金国家重点基础研究发展计划("九七三"计划)(2013CB329302)资助项目国家自然科学基金(61271426 10925419 90920302 61072124 11074275 11161140319)资助项目中国科学院战略性先导科技专项(XDA06030100 XDA06030500)资助项目中国科学院重点部署(KGZD-EW-103-2)资助项目江西理工大学科研基金(NSFJ2015-G21)资助项目

关键词语音增强噪声功率谱估计隐马尔可夫模型极大似然准则模型约束 speech enhancement noise power estimation hidden Markov model maximum likelihood criterion model constraints

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献14

1Yuan Wenhao, Lin Jiajun, An Wei, et al. Noise estimation based on time-frequency correlation for speech enhancement[J]. Applied Acoustics, 2013, 74(5): 770-781.
2赵胜跃,戴蓓蒨.基于最小统计噪声估计的信号子空间语音增强[J].数据采集与处理,2007,22(4):453-457. 被引量：6
3Zhong L, Rafik A G, Richard M D. Noise estimation using speech/non-speech frame decision and subband spectral tracking[J]. Speech Communication, 2007, 49: 542-557.
4余耀,赵鹤鸣.非平稳噪声环境下的噪声功率谱估计方法[J].数据采集与处理,2012,27(4):486-489. 被引量：7
5Martin R. Bias compensation methods for minimum statistics noise power spectral density estimation[J]. Signal Processing, 2006, 86: 1215-1229.
6Cohen I. Noise estimation by minima controlled reeursive averaging for robust speech enhancement[J]. IEEE Signal Process Letters, 2002, 9(1):12-15.
7Cohen I. Noise spectrum estimation in adverse environments: Improved minima controlled recursive averaging[J]. IEEE Transaction on Audio, Speech, and Language Processing, 2003, 11(5): 466-475.
8Quoc V Le. Building high-level features using large scale unsupervised learning [C]//Proc ICASSP13. Vancouver, Canada: IEEE Signal Processing Society, 2013: 8595-8598.
9Frederic P, Yacine C, Ovarlez J P, et al. Covarianee structure maximum-likelihood estimates in compound Gaussian noise: Existence and algorithm analysis[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2008, 56 (1) :34-48.
10Ying D, Yan Y, Dang J, et al. Voice activity detection based on an unsupervised learning framework[J]. IEEE Transaction on Audio, Speech, and Language Processing, 2011, 19(8):2624 -2633.

二级参考文献21

1Ephraim Y, Van Trees H L. A signal subspace approach for speech enhancement [J]. IEEE Trans Speech and Audio Processing, 1995,3(4):251-266.
2Gazor S, Rezayee A. An adaptive KLT approach for speech Enhancement[J]. IEEE Trans on Speech and Audio Processing, 2001,9(2): 97-95.
3Lev-Ari H, Ephraim Y. Extension of the signal subspace speech enhancementapproach to colored noise [J]. IEEE Signal Processing Lett, 2003, 10(4) :104-106.
4Jabloun F, Champagne B. Incorporating the human hearing properties in the signal subspace approach for speech enhancement[J]. IEEE Transactions on Speech and Audio Processing, 2003, 11 (6): 700- 708.
5Gazor S, Zhang W. Speech enhancement employing Laplacian-gaussian mixture[J]. IEEE Transactions on Speech and Audio Processing, 2005, 13 (5):896- 904.
6Martin R. Noise power spectral density estimation based on optimal smoothing and minimum statistics [J]. IEEE Trans on Speech and Audio Processing, 2001,9(5):504-512
7Wan E, Nelson A, Peterson R. Speech enhancement assessment resource (SPEAR) database [EB/OL]. http://ee, ogi. edu/NSEL/Beta Release vl. 0. CSLU, Oregon Graduate Institute of Science and Technology. 1998.
8International Telecommunication Union. Recommendation ITU-T P. 862. Perceptual evaluation of speech quality (PESQ) [S]. 2001.
9Farsi H. Improvement of minimum tracking in mini- mum statistics noise estimation method [J]. Signal Processing.. An International Journal (SPIJ), 2010, 4(1) ..17-22.
10Rainer M. Noise power spectral density estimation based on optimal smoothing and minimum statistics [J]. IEEE Transactions on Speech and Audio Pro- cessing, 2001,9(5):504-512.

共引文献11

1王文杰,王霞,王国君,佟强.一种改进的子空间语音增强方法[J].电子设计工程,2010,18(6):127-129. 被引量：1
2张雪英,贾海蓉,靳晨升.子空间与维纳滤波相结合的语音增强方法[J].计算机工程与应用,2011,47(14):146-148. 被引量：6
3姜占才,孙燕,王得芳.基于谱减和LMS的自适应语音增强[J].计算机工程与应用,2012,48(7):142-145. 被引量：11
4崔晓.拉格朗日乘子受控子空间语音增强[J].计算机工程与应用,2014,50(9):182-185. 被引量：2
5赵丽,邢潇,郭旭宏,刘泽华,何洋.基于稳态视觉诱发电位的脑-机接口无线智能家居系统研究[J].生物医学工程学杂志,2014,31(5):967-970. 被引量：3
6高建,赵丽,孙永.基于稳态视觉诱发电位的字符输入系统研究[J].天津职业技术师范大学学报,2016,26(1):6-9.
7庞亮,刘双东.基于语音存在概率的噪声功率谱估计改进算法[J].电声技术,2017,41(2):39-43. 被引量：2
8王鹏,芮国胜,张洋,刘林芳.应用锁相环技术判别混沌相变的方法[J].电讯技术,2017,57(11):1266-1271. 被引量：1
9舒轶昊,张洋,张坤,刘林芳,董道广.低频信号的混沌高斯化检测方法[J].海军航空工程学院学报,2019,34(5):407-412.
10韩灿灿,李志华,徐睿.基于CycleGAN的非平行语音去噪方法[J].计算机与现代化,2021(2):73-77.

同被引文献41

1汤国安,赵牡丹,李天文,刘咏梅,谢元礼.DEM提取黄土高原地面坡度的不确定性[J].地理学报,2003,58(6):824-830. 被引量：178
2杨玺,樊晓平.基于仿生小波变换和自适应阈值的语音增强方法[J].控制与决策,2006,21(9):1033-1036. 被引量：6
3戴吾蛟,丁晓利,朱建军,陈永奇,李志伟.基于经验模式分解的滤波去噪法及其在GPS多路径效应中的应用[J].测绘学报,2006,35(4):321-327. 被引量：145
4王月,屈百达,徐保国.一种基于仿生小波变换的语音增强方法[J].计算机工程与应用,2008,44(11):165-167. 被引量：2
5李野,吴亚锋,刘雪飞.基于PESQ的空乘人员语音质量评价系统设计与实现[J].测控技术,2009,28(1):31-34. 被引量：2
6陈卫东,王晓亚,解静.基于LPCC的多语种识别算法[J].无线电工程,2009,39(9):16-18. 被引量：4
7杨昕,汤国安,刘学军,李发源,祝士杰.数字地形分析的理论、方法与应用[J].地理学报,2009,64(9):1058-1070. 被引量：95
8曹斌芳,李建奇.基于自适应仿生小波变换的语音增强方法[J].数据采集与处理,2010,25(6):741-745. 被引量：3
9龚亮,张艳萍.基于掩蔽效应的改进型自适应语音增强算法[J].南京信息工程大学学报（自然科学版）,2010,2(6):529-532. 被引量：6
10徐岩,孟静.基于粉红噪声的语音增强算法性能评价研究[J].铁道学报,2011,33(4):53-58. 被引量：10

引证文献4

1董胡,蒋伟进.基于遗传算法的仿生小波语音增强[J].测控技术,2016,35(11):1-4. 被引量：1
2曹建军,那嘉明,汤国安,杨昕.DEM随机噪声误差去除方法研究--以黄土沟沿线地形剖面为例[J].地理与地理信息科学,2017,33(2):12-18. 被引量：5
3凌贤鹏,李绽蕾,刘昊,张钐钐,俞芸芸.基于智能语音的智能家居系统设计[J].物联网技术,2019,9(1):73-74. 被引量：3
4许春冬,周静,应冬文,侯雷静,龙清华.基于DHMM的低心率变异性心音的分割方法[J].数据采集与处理,2019,34(4):605-614. 被引量：2

二级引证文献11

1刘志君,张新明,高亚奎,车军.基于ADEMO/D-ENS的飞控系统性能指标分配方法[J].测控技术,2019,38(7):109-112. 被引量：1
2卫敏.语音识别技术在3D虚拟智能家居系统中的应用研究[J].太原学院学报（自然科学版）,2019,37(3):74-78. 被引量：1
3金雨晨,凌霖,许毅.基于倒谱特征的重放语音检测[J].物联网技术,2020,10(6):86-88.
4高晓,周明杰,曹广山.智能家居发展现状与开放平台探索研究[J].科技创新导报,2020,17(29):80-83.
5陈琦,曹建军,汤国安,刘永娟,方炫,朱莹,李金莲.基于EEMD-瞬时频率变换的黄土高原典型地貌沟蚀活跃区识别研究[J].地理与地理信息科学,2021,37(3):9-15. 被引量：2
6张加宏,孟辉,谢丽君,冒晓莉,周炳宇.基于心冲击图和BP神经网络的心率异常分类研究[J].数据采集与处理,2021,36(3):565-576. 被引量：3
7甘斌,郑俊良,姚顽强,白凌霄.基于数学形态学的机载LiDAR采煤区沉陷信息提取[J].西安科技大学学报,2023,43(1):175-182. 被引量：1
8郑敏学,毛静,孙智灏,朱龙,李志坚,居珍,黄爱国.基于EEMD-MFDFA的镇江港PM_(2.5)演化特征分析[J].江苏大学学报（自然科学版）,2023,44(6):738-744.
9韩磊,赵子林,杨梅丽,刘钊,赵永华.黄土高原沟沿线研究进展与展望[J].中国水土保持科学,2023,21(6):131-143.
10袁世一.基于经验模态分解与极限学习机的粮食产量模型预测[J].计算机与现代化,2024(3):47-53.

1冯炎,安宝坤.改进型加权噪声功率谱估计算法[J].重庆科技学院学报（自然科学版）,2014,16(4):147-149. 被引量：1
2姚磊.基于图像块的EM自适应图像去噪算法[J].科技广场,2017(2):14-17.
3余耀,赵鹤鸣.一种改进的最小统计噪声功率谱估计算法[J].计算机工程与应用,2013,49(4):134-137. 被引量：2
4赵彦平,赵晓晖,王波.基于语音存在概率的噪声功率谱估计[J].吉林大学学报（工学版）,2016,46(3):917-922. 被引量：3
5李滔,李勇.基于正交变换的相位估计方法性能分析[J].电子与信息学报,2008,30(8):1857-1860. 被引量：2
6张铁英,邢永强,张利,王海洋.一种新的数字脉冲间隔调制解调方法[J].激光与光电子学进展,2012,49(8):76-80. 被引量：2
7冯炎,尼玛扎西.基于频带间相关性的加权噪声功率谱估计[J].信息与电子工程,2010,8(4):431-435. 被引量：5
8仲国栋,孙军,杨峰.一种基于EM算法的MIMO-OFDM系统信道估计技术[J].电讯技术,2006,46(3):48-51. 被引量：2
9庞亮,刘双东.基于语音存在概率的噪声功率谱估计改进算法[J].电声技术,2017,41(2):39-43. 被引量：2
10冯炎,安宝坤.基于加权噪声的递归平滑噪声功率谱估计[J].太赫兹科学与电子信息学报,2013,11(5):787-791. 被引量：2

数据采集与处理

2015年第2期

浏览历史

内容加载中请稍等...

基于隐马尔可夫模型的非监督噪声功率谱估计被引量：4

参考文献14

二级参考文献21

共引文献11

同被引文献41

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的非监督噪声功率谱估计 被引量：4

参考文献14

二级参考文献21

共引文献11

同被引文献41

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的非监督噪声功率谱估计被引量：4