噪声谱估计算法对语音可懂度的影响被引量：3

Effects of noise spectrum estimation algorithms on speech intelligibility

下载PDF

导出

摘要噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。 Noise spectrum estimation is a key step in single channel speech enhancement algorithms. Most of current speech enhancement algorithms are designed to improve speech quality, however, algorithms for increasing speech intelligibility are few. The traditional speech enhancement algorithms improve speech quality, while sacrificing speech intelligibility. In this paper, classical noise spectrum estimation algorithms are evaluated for their effects on speech intelligibility. Noise spectrum is estimated in different noise environments with SNRs between ？9 d B and 3 d B. The spectral subtraction is thereafter used for speech denoising. The STOI（Short-Time Objective Intelligibility） value of the enhanced speech is computed. At last, according to the signal-to-noise ratio, the proportions of speech dominated time-frequency blocks under different noise environments are analyzed. Experimental results show that, compared with other noise estimation algorithms, the minimum statistics（MS） obtains high speech intelligibility because it retains more speech dominated time-frequency blocks after speech denoising.

作者张建伟陶亮周健王华彬

机构地区安徽大学计算智能与信号处理教育部重点实验室

出处《声学技术》 CSCD 北大核心 2015年第5期424-430,共7页 Technical Acoustics

基金国家自然科学基金(61301219 61003131) 安徽省自然科学基金(1408085MF113)资助项目

关键词噪声谱估计谱减法时频块最小统计短时客观可懂度语音可懂度 noise spectrum estimation spectrum subtraction time-frequency blocks Minima Statistics（MS） Short-Time Objective Intelligibility（STOI） speech intelligibility

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献27

1Yuan W, Lin J, An W, et al. Noise estimation based on time-frequency correlation for speech enhancement[J]. Applied Acoustics, 2013, 74(5): 770-781.
2Lu Ching-Ta. Noise reduction using three-step gain factor and iterative-directional-median filter[J]. Applied Acoustics, 2014, 76(1): 249-261.
3Ming Ji. Crookes, Danny. An iterative longest matching segment approach to speech enhancement with additive noise and channel distortion[J]. Computer Speech and Language, 2014, 28(6): 1269-1286.
4Lim J. Evaluation of a correlation subtraction method for enhanc- ing speech degraded by additive noise[J]. IEEE Transactions on Acoustics, Speech and Sinai Processing, 1978, 37(6): 471-472.
5Hu Y, Loizou P. A comparative intelligibility study of sin-gle-microphone noise reduction algorithms[J]. J. Acoust. Soc. Am., 2007, 122(3): 1777-1786.
6Loizou P, Kim G. Reasons why current speech-enhancement algo- rithms do not improve speech intelligibility and suggested solu- tions[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011, 19(1): 47-56.
7McAulay R, Malpass M. Speech enhancement using a soft-decision noise suppression filter[J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1980, 28(2): 137-145.
8McKinley B, Whipple G. Model based speech pause detection[C]// Acoustics, Speech, and Signal Processing, 1997. ICASSP-97., 1997 IEEE International Conference on. 1997, 2: 1179-1182.
9Meyer J, Simmer K, Kammeyer K. Comparison of one and two-channel noise-estimation techniques[C]// Proc. 5th Interna- tional Workshop on Acoustics Echo and Noise Control, IEAENC-97. 1997, 137-145.
10Solm J, Kim N, Sung W. A statistical model-based voice activity detection[J]. Signal Processing Letters, IEEE, 1999, 6(1): 1-3.

同被引文献19

1欧世峰,赵晓晖.改进型先验信噪比估计语音增强算法[J].吉林大学学报（工学版）,2009,39(3):787-791. 被引量：3
2程宁,刘文举.基于高斯-拉普拉斯-伽玛模型和人耳听觉掩蔽效应的信号子空间语音增强算法[J].声学学报,2009,34(6):554-565. 被引量：6
3曾毓敏,王鹏.基于双向搜索方法的最小值控制递归平均语音增强算法[J].声学学报,2010,35(1):81-87. 被引量：8
4徐子豪,张腾飞.基于语音识别和无线传感网络的智能家居系统设计[J].计算机测量与控制,2012,20(1):180-182. 被引量：67
5张永刚,余玉平.基于ARM的孤立语音识别系统的研究[J].广东工业大学学报,2013,30(2):95-98. 被引量：5
6隋璐瑛,张雄伟,黄建军,赵改华.基于码本学习的改进谱减语音增强算法[J].计算机工程与应用,2013,49(16):216-220. 被引量：3
7万义龙,张天骐,王志朝,金静.一种基于几何谱减法和听觉掩蔽效应的语音增强方法[J].微电子学与计算机,2014,31(2):80-84. 被引量：5
8曹龙涛,李如玮,鲍长春,吴水才.基于噪声估计的二值掩蔽语音增强算法[J].计算机工程与应用,2015,51(17):222-227. 被引量：4
9张正文,周航麒.基于多窗谱估计的维纳滤波语音增强算法[J].河南理工大学学报（自然科学版）,2015,34(5):686-690. 被引量：6
10恩德,陈亚柯,毛哲龙.基于FastICA的低信噪比下L-PLC语音的间断传输[J].计算机工程与应用,2016,52(9):108-111. 被引量：2

引证文献3

1吴进,赵隽,李乔深.基于维纳过滤的IMCRA算法[J].西安邮电大学学报,2017,22(5):73-77. 被引量：2
2吴楠,冯祖勇,韦高梧.智能语音识别系统中噪声估计算法的研究和改进[J].广东工业大学学报,2018,35(3):43-46. 被引量：3
3李湑,胡俊,刘新,黄石磊.基于多窗谱估计和几何谱减的低信噪比语音增强方法[J].微电子学与计算机,2018,35(11):62-66. 被引量：2

二级引证文献7

1徐冬.门诊导医机器人的应用及探索[J].医学信息,2019,32(1):28-30. 被引量：8
2王岭娥,白佳荣.基于语音控制的智能家居系统的设计与实现[J].华北理工大学学报（自然科学版）,2019,41(3):135-140. 被引量：14
3张行,赵馨.基于神经网络噪声分类的语音增强算法[J].中国电子科学研究院学报,2020,15(9):880-885. 被引量：4
4朱训谕,潘翔.基于麦克风线阵的语音增强算法研究[J].杭州电子科技大学学报（自然科学版）,2020,40(5):30-33. 被引量：1
5张开生,赵小芬.双重约束非负矩阵分解与改进正交匹配追踪算法的语音增强[J].河南科技大学学报（自然科学版）,2021,42(1):54-60. 被引量：4
6张婷,马延周,李宏欣.基于DCNN的语音识别降噪方法研究[J].现代电子技术,2021,44(23):48-51. 被引量：3
7牟莉,佘石豪,孟玉茹.基于主体-延伸法的基音周期检测改进算法[J].西安工程大学学报,2022,36(1):121-128. 被引量：3

1周成燕,周强,顾济华,赵鹤鸣,陶智.基于约束方差的噪声谱估计算法[J].计算机工程与应用,2012,48(18):127-131. 被引量：2
2鞠峰,张宏伟,何强,韩壮志.一种基于最小统计噪声估计的改进谱减法[J].信息技术,2013,37(10):141-144.
3王月明,施玉霞.非平稳噪声环境下的噪声估计算法[J].电声技术,2006,30(11):59-62. 被引量：2
4雷超,张文轩.基于三种估计准则下的语音增强方法[J].计算机仿真,2008,25(11):137-141.
5戴筠,王建海,方振和,李英.分布序贯最近邻多目标跟踪算法[J].系统工程与电子技术,1998,20(7):11-14. 被引量：3
6刘慧,彭良玉,刘美华.基于小波变换的图像去噪研究[J].微型机与应用,2011,30(23):54-55. 被引量：1
7汪雅兰,贾振红,杨杰,庞韶宁.基于NSCT域主分量分析的遥感图像去噪方法[J].计算机工程与应用,2011,47(30):195-197. 被引量：3
8孟欣,马建芬,张雪英.一种低信噪比条件下的高可懂度的语音增强算法[J].计算机应用与软件,2016,33(10):145-147. 被引量：3
9梁佩璧,许枫.一种带通滤波后语音可懂度的客观评价方法[J].微计算机应用,2010,31(6):44-49.
10董胡,蒋伟进.基于遗传算法的仿生小波语音增强[J].测控技术,2016,35(11):1-4. 被引量：1

声学技术

2015年第5期

浏览历史

内容加载中请稍等...

噪声谱估计算法对语音可懂度的影响被引量：3

参考文献27

同被引文献19

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

噪声谱估计算法对语音可懂度的影响 被引量：3

参考文献27

同被引文献19

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

噪声谱估计算法对语音可懂度的影响被引量：3