修正的基于广义Gamma语音模型语音增强算法被引量：1

Modified speech enhancement algorithm under signal presence probability with generalized Gamma speech model

下载PDF

导出

摘要广义Gamma模型是近年来新提出的一种语音分布模型,相对于传统的高斯或超高斯模型具有更好的普适性和灵活性,提出一种基于广义Gamma语音模型和语音存在概率修正的语音增强算法。在假设语音和噪声的幅度谱系数分别服从广义Gamma分布和Gaussian分布的基础上,推导了语音信号对数谱的最小均方误差估计式;在该模型下进一步推导了语音存在概率,对最小均方误差估计进行修正。仿真结果表明,与传统的短时谱估计算法相比,该算法不仅能够进一步提高增强语音的信噪比,而且可以有效减小增强语音的失真度,提高增强语音的主观感知质量。 This paper presents a modified speech enhancement algorithm under signal presence probability. Generalized Gamma distribution priors are assumed for speech short-time spectral amplitudes, which is more flexible in capturing the statistical behavior of speech signals. It derives a Minimum Mean-Square Error（MMSE）estimator of the log-spectra am-plitude for speech signals, under the assumption of a generalized Gamma speech priors and additive Gaussian noise priors. Furthermore, modification under signal presence probability is obtained, which is estimated for each frequency bin and each frame consistent with the new model. The simulation results show that the proposed algorithm achieves better noise suppression and lower speech distortion compared to the conventional short-time spectral amplitude estimators, which are based on Gaussian and super-Gaussian speech model.

作者赵改华周彬张雄伟

机构地区解放军理工大学指挥信息系统学院

出处《计算机工程与应用》 CSCD 2014年第18期230-235,共6页 Computer Engineering and Applications

关键词语音增强语音存在概率广义Gamma分布最小均方误差对数谱 speech enhancement speech presence probability generalized Gamma distribution Minimum Mean-SquareError （ MM SE） log-spectral

分类号 TP912.3 [自动化与计算机技术]

引文网络
相关文献

参考文献13

1Ephraim Y,Malah D.Speech enhmcement using a mini- mum mean-square error short-time spectral amplitude esti- mator[J].IEEE Trans on Acoust Speech, Signal Process, 1984,32(6) : 1109-1121.
2Ephraim Y,Malah D.Speech enhancement using a mini- mum mean-square error log-spectral amplitude estimator[J]. IEEE Trans on Acoust Speech,Signal Process,1985,33 (2) :443-445.
3Cohen I.Optimal speech enhancement under signal pres- ence uncertainty using log-spectral amplitude estimator[J]. IEEE Signal Process Lett,2002,9(4).
4Gazor S, Zhang W.Speech probability distribution[J].IEEE Signal Process Lett,2003,10(7).
5Martin R.Speech enhancement based on minimum mean- square error estimation and super gaussian priors[J].IEEE Trans on Speech Audio Process, 2005,13 (5) : 845-856.
6Lotter T,Vary P.Speech enhancement by MAP spectral amplitude estimation using a super-Gaussian speech model[J]. Eurasip J Signal Process,2005(7) : 1110-1126.
7邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
8Erkelens J S, Hendriks R C, Heusdens R, et al.Minimum mean-square error estimation of discrete flourier coeffi- cients with generalized Gamma priors[J].IEEE Trans on Audio, Speech, Language Process, 2007,15 (6) : 1741-1752.
9Borgstrom B J,Alwan A.Log-spectral amplitude estima- tion with generalized Gamma distributions for speech enhancement[C]//IEEE Int Conf Acoustic, Speech, Signal Process (ICASSP), Prague, Czech, 2011 : 4756-4759.
10Thomas E, Peter V.Model-based speech enhancement using SNR dependent MMSE estimation[C]//IEEE Int Conf Acoustic, Speech, Signal Process(ICASSP) ,Prague, Czech, 2011:4652-4655.

二级参考文献16

1EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1984,32(6):1109-1121.
2EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error log-spectral amplitude estimator[J].IEEE Trans Acoustic,Speech,Signal Processing,1985,33(2):443-445.
3SOON I Y,KOH S N,YEO C K.Noisy speech enhancement using discrete cosine transform[J].Speech Communication,1998,24(3):249-257.
4GAZOR S,ZHANG W.Speech probability distribution[J].IEEE Signal Processing Letters,2003,10(7):204-207.
5MARTIN R.Statistical methods for the enhancement of noisy speech[A].IWAENC'2003[C].2003.1-6.
6MARTIN R.Speech enhancement using MMSE short time spectral estimation with Gamma distributed speech priors[A].ICASSP'2002[C].2002.253-256.
7MARTIN R,BREITHAUPT C.Speech enhancement in the DFT domain using Laplacian speech priors[A].IWAENC'2003[C].2003.87-90.
8BREITHAUPT C,MARTIN R.MMSE estimation of magnitudesquared DFT coefficients with supergaussian priors[A].ICASSP'2003[C].2003.896-899.
9CHEN B,LOIZOU P C.Speech enhancement using a MMSE short time spectral amplitude estimator with Laplacian speech modeling[A].ICASSP'2005[C].2005.1097-1100.
10GAZOR S.Employing Laplacian-Gaussian densities for speech enhancement[A].ICASSP'2004[C].2004.297-300.

共引文献10

1黄建军,张雄伟,张亚非,邹霞.时频字典学习的单通道语音增强算法[J].声学学报,2012,37(5):539-547. 被引量：13
2赵改华,周彬,张雄伟.基于超高斯混合模型的语音幅度谱增强算法[J].通信技术,2013,46(6):137-141.
3隋璐瑛,张雄伟,黄建军,赵改华.基于码本学习的改进谱减语音增强算法[J].计算机工程与应用,2013,49(16):216-220. 被引量：3
4赵改华,周彬,张雄伟.基于自适应超高斯混合模型的语音增强算法[J].数据采集与处理,2014,29(2):232-237. 被引量：2
5胡永刚,张雄伟,邹霞,张立伟,郑云飞.贝叶斯非负矩阵分解语音增强的优化算法[J].解放军理工大学学报（自然科学版）,2015,16(1):1-6. 被引量：2
6庞亮,陈亮,张翼鹏,黄清泉.基于增益字典查询的语音增强算法[J].计算机科学,2015,42(10):16-19.
7胡永刚,张雄伟,邹霞,闵刚,张立伟,王健.ADMM稀疏非负矩阵分解语音增强算法[J].计算机工程与应用,2016,52(3):108-112. 被引量：2
8韩伟,张雄伟,周星宇,白崧廷,闵刚.联合优化深度神经网络和约束维纳滤波的单通道语音增强方法[J].计算机应用研究,2017,34(3):706-709. 被引量：6
9韩伟,张雄伟,闵刚,张启业.基于感知掩蔽深度神经网络的单通道语音增强方法[J].自动化学报,2017,43(2):248-258. 被引量：18
10鲍长春,白志刚.基于非负矩阵分解的语音增强方法综述[J].信号处理,2020,36(6):791-803. 被引量：2

同被引文献10

1邹霞,陈亮,张雄伟.基于Gamma语音模型的语音增强算法[J].通信学报,2006,27(10):118-123. 被引量：11
2Loizuo P C. Speech Enhancement Theory and Practice[M]. CRCPress,2007:337-377.
3Wu D L, Zhu W P, Swamy M N S. Noise Spectrum Estimationwith Improved Minimum Controlled Recursive Averaging basedon Speech Enhancement Residue[C] // IEEE International Mid-west Symposium on Circuits and Systems ( MWSCAS). Boise,USA,2012:945-951.
4Yong P C,Nordholm S,Dam H H. Trade-off Evaluation forSpeech Enhancement Algorithms with Respect to The a PrioriSNR Estimation[C] // IEEE International Conference on Acous-tics, Speech and Signal Processing (ICASSP). Kyoto, Japan,2012:4657-4660.
5Ekelens J, Jensen J, Heusdens R. A Data-Driven Approach toOptimizing Spectral Speech Enhancement Methods for VariousError Criteria[J]. Speech Communication, 2007,49 (5) : 530-541.
6陈立伟,王文姝,袁頔.自适应高斯混合模型语音增强方法[J].应用科技,2009,36(7):11-15. 被引量：2
7杨波,王新房.基于非因果先验信噪比估计的语音增强改进算法[J].计算机系统应用,2012,21(7):200-202. 被引量：3
8周彬,邹霞,张雄伟.基于多元Laplace语音模型的语音增强算法[J].电子与信息学报,2012,34(7):1562-1567. 被引量：4
9梁岩,鲍长春,夏丙寅,何玉文,周璇,李娜.基于高斯混合模型的压缩域语音增强方法[J].电子学报,2012,40(10):2031-2038. 被引量：9
10晏光华.一种基于MMSE-LSA和VAD的语音增强算法[J].移动通信,2014,38(10):59-62. 被引量：2

引证文献1

1庞亮,陈亮,张翼鹏,黄清泉.基于增益字典查询的语音增强算法[J].计算机科学,2015,42(10):16-19.

1赵改华,周彬,张雄伟.基于超高斯混合模型的语音幅度谱增强算法[J].通信技术,2013,46(6):137-141.
2赵改华,周彬,张雄伟.基于自适应超高斯混合模型的语音增强算法[J].数据采集与处理,2014,29(2):232-237. 被引量：2
3听写机及其语音模型[J].科技开发动态,2003(8):24-24.
4高丛珊,张红,王超,吴樊.广义Gamma模型及自适应KI阈值分割的SAR图像变化检测[J].遥感学报,2010,14(4):710-724. 被引量：16
5宫云梅,赵晓群,史仍辉.基于语音存在概率和听觉掩蔽特性的语音增强算法[J].计算机应用,2008,28(11):2981-2983. 被引量：2
6张东方,蒋建中,张连海.一种改进型IMCRA非平稳噪声估计算法[J].计算机工程,2012,38(13):270-272. 被引量：6
7蒋建中,张东方,张连海.一种新的强噪声环境下的语音增强算法[J].计算机工程与应用,2013,49(20):222-225. 被引量：3
8王炜华,沈振康.基于红外图像统计模型的分割方法[J].红外与激光工程,2003,32(6):620-623. 被引量：2
9曹荣,王颖,李象霖.一种自适应的DFT域数字水印算法[J].计算机工程与应用,2006,42(10):77-78. 被引量：11
10林晓钢,汪文林,何渝,郭永彩.一种高识别率的语音密码锁[J].重庆大学学报（自然科学版）,2008,31(3):307-310. 被引量：1

计算机工程与应用

2014年第18期

浏览历史

内容加载中请稍等...

修正的基于广义Gamma语音模型语音增强算法被引量：1

参考文献13

二级参考文献16

共引文献10

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

修正的基于广义Gamma语音模型语音增强算法 被引量：1

参考文献13

二级参考文献16

共引文献10

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

修正的基于广义Gamma语音模型语音增强算法被引量：1