基于自适应超高斯混合模型的语音增强算法被引量：2

Speech Enhancement Algorithm Based on Adapted Super-Gaussian Mixture Model

下载PDF

导出

摘要语音信号的频谱结构复杂性决定了其短时谱分布不能用单一的概率密度函数(Probability density function,PDF)准确描述。据此,提出了一种采用超高斯混合模型对语音信号幅度谱建模以实现语音增强的新方法。首先,采用超高斯混合模型对语音信号幅度谱的先验分布进行建模,相对于传统的单一模型,该模型能更好地描述语音信号的多类特性;然后,在增强过程中自适应更新混合分量的PDF及其权重,从而克服了传统模型难以跟踪语音信号分布动态变化的缺点。仿真结果表明与传统的短时谱估计算法相比,该算法的噪声抑制性能有较大的提升,增强语音的主观感知质量也有明显改善。 The observation of speech spectral structure shows that the statistics of speech signal cannot be well determined by a simple probability density function （PDF）. Therefore, a speech enhancement algorithm is presented based on the super-Gaussian mixture model. Firstly, the super Gaussian mixture model is employed to model the speech spectral amplitude, which is more flexible in capturing the statistical behavior of speech signals than the conventional simple speech model. Where after, PDF and weight of the mixture components are further adapted, which can overcome the disadvantage that the traditional simple speech model cannot well track the dynamic characteristics of the speech signal. The simulation results show that the proposed algorithm achieves better noise suppression and lower speech distortion compared with the con- ventional short-time spectral estimation algorithms.

作者赵改华周彬张雄伟

机构地区解放军理工大学指挥信息系统学院

出处《数据采集与处理》 CSCD 北大核心 2014年第2期232-237,共6页 Journal of Data Acquisition and Processing

关键词语音增强超高斯混合模型自适应 speech enhancement super-Gaussian mixture model adaptation

分类号 TP912.3 [自动化与计算机技术]

引文网络
相关文献

参考文献15

1Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error short-time spectral am- plitude estimator [J]. IEEE Trans Acoust Speech, Signal Process, 1984,32(6) :1109- 1121.
2Gazor S, Zhang W. Speech probability distribution [J]. IEEE Signal Process Lett, 2003,10(7):2042- 207.
3Martin R. Speech enhancement based on minimum mean-square error estimation and super Gaussian pri- orsEJ~. IEEE Trans Speech Audio Process, 2005,13 (5) :845-856.
4Lotter T, Vary P. Speech enhancement by MAP spectral amplitude estimation using a super-Gaussian speech model[J]. Eurasip J Signal Process, 2005, (7) :1110-1126.
5邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
6Hendriks R C. Heusdens R, Jensen J. Log-spectral magnitude MMSE estimators under super-gaussian densities[J]. Inter Speech, 2009,10(6) :1319-1322.
7Ephraim Y. A Bayesian estimation approach for speech enhancement using hidden Markov models [J]. IEEE Trans Acoust Speech, Signal Process, 1992, 40(4) :725-735.
8Ding Guohong, Wang Xia, Cao Yang, et al. Speech enhancement based on speech spectral complex Gaussian mixture model[C]//IEEE Int Conf Acous- tic, Speech, Signal Process (ICASSP). Philadephia, USA: IEEE, 2005 :165-168.
9Erkelens J S, Jensen J, Heusdens R. Speech en- hancement based on Rayleigh mixture modeling of speech spectral amplitude distributions[C]//Europe- an Signal Proc Conf (EUSIPCO). Poznan, Poland.. [s. n. ], 2007:65-69.
10Hao Jiucang, Lee Te-Won. Speech enhancement using Gaussian scale mixture models[J]. IEEE Trans on ASLP, 2010,18(6):1127-1136.

二级参考文献25

1Manolakis D G.Statistical and adaptive signal processing[M].New York:McGraw-Hill,2003:21-26.
2Bahoura M,Rouat J.Wavelet speech enhancement based on the teager energy operator[J].IEEE Signal Processing Letters,2001,8(1):10-12.
3Yao J,Zhang Y T.Bionic wavelet transform:A newtime-frequency method based on an auditory model[J].IEEE Trans on Biomedical Engineering,2001,48(8):856-863.
4Loizou H Y,Philipos C.Speech enhancement based on wavelet thresholding the multitaper spectrum[J].IEEE Trans on Speech and Audio Processing,2004,12(1):59-67.
5Chen S H,Wang J F.Speech enhancement using perceptual wavelet packet decomposition and teager energy operator[J].Journal of VLSI Signal Processing,2004,36(2):125-139.
6Lei S F,Tung Y K.Speech enhancement for nonstationary noises by wavelet packet transform and adaptive noise estimation[C] //International Sym on Intelligent Signal Processing and Comm Systems.Hong Kong,China:[s.n.] ,2005:41-44.
7Donoho D L.De-noising soft-thresholding[J].IEEE Trans on Information Theory,1995,51(3);613-627.
8EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1984,32(6):1109-1121.
9EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error log-spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1985,33(2):443-445.
10SOON I Y,KOH S N,YEO C K.Noisy speech enhancement using discrete cosine transform[J].Speech Communication,1998,24(3):249-257.

共引文献11

1黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
2赵改华,周彬,张雄伟.基于超高斯混合模型的语音幅度谱增强算法[J].通信技术,2013,46(6):137-141.
3隋璐瑛,张雄伟,黄建军,赵改华.基于码本学习的改进谱减语音增强算法[J].计算机工程与应用,2013,49(16):216-220. 被引量：3
4赵改华,周彬,张雄伟.修正的基于广义Gamma语音模型语音增强算法[J].计算机工程与应用,2014,50(18):230-235. 被引量：1
5胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报（自然科学版）,2015,16(1):1-6. 被引量：2
6庞亮,陈亮,张翼鹏,黄清泉.基于增益字典查询的语音增强算法[J].计算机科学,2015,42(10):16-19.
7胡永刚,张雄伟,邹霞,闵刚,张立伟,王健.ADMM稀疏非负矩阵分解语音增强算法[J].计算机工程与应用,2016,52(3):108-112. 被引量：2
8董胡,蒋伟进.基于遗传算法的仿生小波语音增强[J].测控技术,2016,35(11):1-4. 被引量：1
9韩伟,张雄伟,周星宇,白崧廷,闵刚.联合优化深度神经网络和约束维纳滤波的单通道语音增强方法[J].计算机应用研究,2017,34(3):706-709. 被引量：6
10韩伟,张雄伟,闵刚,张启业.基于感知掩蔽深度神经网络的单通道语音增强方法[J].自动化学报,2017,43(2):248-258. 被引量：18

同被引文献11

1邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
2赵改华.基于统计模型及信号融合的语音增强算法研究[D].南京:解放军理工大学,2013.
3张丽艳,殷福亮.一种改进的奇异值分解语音增强方法[J].电子与信息学报,2008,30(2):357-361. 被引量：11
4王青云,赵力,乔杰,邹采荣.基于加权次梯度投影算法的数字助听器自适应声反馈抑制[J].信号处理,2009,25(4):519-525. 被引量：6
5王青云,赵力,赵立业,邹采荣.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835. 被引量：21
6曹斌芳,李建奇.基于自适应仿生小波变换的语音增强方法[J].数据采集与处理,2010,25(6):741-745. 被引量：3
7孙林慧,杨震.基于数据驱动字典和稀疏表示的语音增强[J].信号处理,2011,27(12):1793-1800. 被引量：14
8张立伟,贾冲,张雄伟,闵刚,曾理.稀疏卷积非负矩阵分解的语音增强算法[J].数据采集与处理,2014,29(2):259-264. 被引量：13
9梁瑞宇,周健,王青云,奚吉,赵力.仿人耳听觉的助听器双耳声源定位算法[J].声学学报,2015,40(3):446-454. 被引量：12
10赵力,张昕然,梁瑞宇,王青云.数字助听器若干关键算法研究现状综述[J].数据采集与处理,2015,30(2):252-265. 被引量：9

引证文献2

1胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报（自然科学版）,2015,16(1):1-6. 被引量：2
2邹采荣,梁瑞宇,谢跃.数字助听器语音处理算法研究进展与展望[J].数据采集与处理,2016,31(2):242-251. 被引量：5

二级引证文献7

1赵力,梁瑞宇,谢跃,庄东哲.语音测谎技术研究现状与展望[J].数据采集与处理,2017,32(2):246-257. 被引量：6
2李斌,张玲华.一种广义旁瓣抵消器结构的语音增强改进算法[J].数据采集与处理,2017,32(2):307-313. 被引量：5
3郭如雪,赵力,梁瑞宇,邹采荣.数字助听器中非均匀余弦调制滤波器组的有效设计方法（英文）[J].Journal of Southeast University(English Edition),2017,33(2):140-144.
4吴伟桐,张伟.基于多元正态概率模型的贝叶斯概率矩阵分解研究[J].科技通报,2017,33(9):29-32. 被引量：2
5沈舷,郭如雪,赵力.一种用于听力矫正系统中非均匀余弦调制滤波器组的设计[J].电子器件,2019,42(5):1169-1173. 被引量：3
6文锁.基于深神经网络的线性回波抵消与不完全传递函数的凸重构[J].计算机测量与控制,2020,28(6):108-112. 被引量：1
7曹丽静.语音增强技术研究综述[J].河北省科学院学报,2020,37(2):30-36. 被引量：7

1赵改华,周彬,张雄伟.基于超高斯混合模型的语音幅度谱增强算法[J].通信技术,2013,46(6):137-141.
2赵改华,周彬,张雄伟.修正的基于广义Gamma语音模型语音增强算法[J].计算机工程与应用,2014,50(18):230-235. 被引量：1
3李仁良,高大启.一种基于独立分量分析的数字字符识别方法研究[J].计算机工程与科学,2006,28(2):74-76. 被引量：3
4吴叶晨,陶俊勇,蒋瑜,陈循.超高斯振动加速度信号的积分方法与试验研究[J].数据采集与处理,2012,27(S2):310-314. 被引量：3
5理华,侯朝焕,马晓川,杨俊.一种适用于微弱信号提取的盲源分离算法[J].应用声学,2009,28(4):249-253. 被引量：2
6Yifan Xing Jun Wu.Controlling the probability density of quantum systems[J].Journal of Systems Engineering and Electronics,2011,22(6):975-981.
7王鹏宇,陈怀海.一种单输入单输出超高斯振动试验控制方法[J].国外电子测量技术,2016,35(3):67-70. 被引量：5
8史晓非,刘人杰.参数化自适应图像盲分离算法[J].传感技术学报,2005,18(4):919-922. 被引量：1
9张萌,陈恳.在线提高卡尔曼滤波跟踪精度的参数研究[J].计算机工程与应用,2012,48(29):162-167. 被引量：1
10戴晓东.物联网工程及网络平台[J].计算机光盘软件与应用,2013,16(5):59-59.

数据采集与处理

2014年第2期

浏览历史

内容加载中请稍等...

基于自适应超高斯混合模型的语音增强算法被引量：2

参考文献15

二级参考文献25

共引文献11

同被引文献11

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于自适应超高斯混合模型的语音增强算法 被引量：2

参考文献15

二级参考文献25

共引文献11

同被引文献11

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于自适应超高斯混合模型的语音增强算法被引量：2