复杂环境下基于准干净语音的音质评价方法被引量：4

Quasi-clean speech-based speech quality evaluation method under complex environments

导出

摘要提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准干净语音作为改进的主观语音质量评估(PESQ)算法的参考语音,计算参考语音与带噪语音之间的失真误差,获得带噪语音的客观评价分值.实验结果表明:该算法客观评分相关度达到0.927,与有参考源语音质量客观评价标准的相关度0.931相比,实现了99%的接近,与无参考源的客观评价标准相比,提高了7.4%. A new non-intrusive evaluation method for complex environments noise was proposed.The method was based on quasi-clean speech construction and intrusive perceptual assessment,and a similar performance to that of intrusive evaluation was achieved.Firstly,an improved minima controlled recursive averaging and a multi-band spectral subtraction algorithm were used to obtain the quasi-clean speech from the noisy speech.Then the quasi-clean speech was regarded as the reference speech to a modified version of perceptual evaluation of speech quality（PESQ）.The distortion between the quasi clean speech and the noisy speech was measured by the PESQ model,and the mean opinion score（MOS）was attained.Experimental results demonstrate that the proposed method gets a objective score correlation of 0.927,which is 99%similar to 0.931 of Reference source speech quality objective evaluation criteria,and 7.4% superior to objective evaluation criteria without reference source.

作者周伟力贺前华李艳雄刘杨

机构地区华南理工大学电子与信息学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第7期121-126,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金资助项目(61571192) 广东省公益基金资助项目(2015A010103003)

关键词语音质量客观评价无参考源复杂环境准干净语音构造 speech quality objective evaluation non-intrusive complex environments quasi-clean speech construction

分类号 TN912.31 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献18

1Gierlich H, Heute U, Moeller S. Advances in perceptual modeling of speech quality in telecommunications[C] // Proc of the 11th ITG Symposium on Speech Communication. Erlangen: VDE, 2014: 1-4.
2Hu Y, Loizou P C. Subjective evaluation and comparison of speech enhancement algorithms[J]. Speech Communication, 2007, 49: 588-601.
3王晶,谢湘,李婧欣,高麟鹏.音频质量评价标准研究[J].信息技术与标准化,2014(3):39-42. 被引量：6
4Loizou P C.语音增强-理论与实践[M].高毅,肖莉,等译.四川:电子科技大学出版社,2012.
5谭晓衡,许可,秦基伟.基于听觉感知特性的语音质量客观评价方法[J].西南交通大学学报,2013,48(4):756-760. 被引量：6
6ITU-T. P. 862-01 Perceptual evaluation of speech quality (PESQ): an objective method for end to end speech quality assessment of narrow-band telephone networks and speech codecs[S]. Geneva: ITU-T, 2001.
7张伟伟,常永宇,刘奕彤,杨大成.中文环境下PESQ评价语音编解码器的性能[J].北京邮电大学学报,2014,37(3):115-119. 被引量：3
8Ludovic M, Jens B, Martin K. P. 563-the ITU-T standard for single-ended speech quality assessment [J].IEEE Transactions on Audio, Speech and Language Processing, 2006, 14(6): 1924-1934.
9Falk T H, Cosentino S, Santos J, et al. Non-intrusive objective speech quality and intelligibility prediction for hearing instruments in complex listening environments[C] //Proc of 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Vancouver: IEEE, 2013: 7820- 7824.
10Manish N, Lin Weisi, Ian V M, et al. Non-intrusive speech quality assessment with support vector regression[J].Advances in Multimedia Modeling, 2010, 59: 325-335.

二级参考文献25

1陈华伟,靳蕃.基于感知模型的美尔谱失真测度[J].西南交通大学学报,2006,41(6):723-728. 被引量：4
2张军,张德运,傅鹏.一种改进的心理声学语音质量客观评价算法[J].微电子学与计算机,2007,24(3):203-206. 被引量：6
3Telecommunication Standardization Sector of ITU. ITU- T Recommendation P. 830 Subjective performance assessment of telephone-band and wideband digital codecs[ S]. Geneva: International Telecommunication Union, 1996.
4Telecommunication Standardization Sector of ITU. ITU- T Recommendation P. 862 Perceptual evaluation of speech quality (PESQ) : An objective method for end- to-end speech quality assessment of narrow-band telephone networks and speech codecs[ S]. Geneva: International Telecommunication Union, 2001.
5KUBICHEK R. Mel-cepstral distance measure for objective speech quality assessment[ C]//Proceedings of IEEE Pacific Rim Conference on Communications, Computer and Signal Processing. Piscataway: IEEE Press, 1993: 125-128.
6DAVIS S B, MERMELSTEIN P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences[ J ]. IEEE Trans. on Acoustics, Speech and Signal Processing, 1980, 28(4) : 357-366.
7JOHANNESMA P I M. The pre-response stimulus ensemble of neurons in the cochlear nucleus [ C ] //// Proceedings of the Symposium on Hearing Theory. Eindhoven: IPO, 1972: 58-69.
8Pohlmann KC.数字音频原理与应用[M].苏菲,译.第四版.北京:电子工业出版社,2002.
9数字音视频编解码技术标准工作组.AVS技术创新报告(2002-2010)-第4部分:AVS音频编解码技术[M],北京:人民邮电出版社,2011..
10ITU-T. Definition of quality of experience (QoE) [S]. International Telecommunication Union Ref: TD 109rev2 (PLEN/12), 2007.

共引文献12

1徐静云,赵晓群,李荣芸,王峤.基于语音截止频率的声码器激励模型[J].北京邮电大学学报,2015,38(3):28-33.
2冯敏,罗旺,余磊,洪功义,彭启伟,张天兵,张云翔,曹玲玲.基于无参考质量评估的会议电视运维系统研究[J].计算机技术与发展,2016,26(7):187-191. 被引量：2
3李庆先,卞昕,刘良江,朱宪宇,周鑫.基于Gammatone滤波器组的客观语音质量评估[J].计算技术与自动化,2016,35(3):76-80. 被引量：5
4张璐琳.随机森林在通信干扰效果客观评价中的应用[J].无线电通信技术,2016,42(5):88-91.
5王霞,马俊晖,王光艳,张艳.面罩语音质量评价算法适用性研究[J].计算机工程与应用,2017,53(19):114-117. 被引量：1
6许亮,赵松波,高强,莫家庆,吕小毅,郭翔.PSO-BP神经网络在语音干扰效果评估中的应用[J].现代电子技术,2019,42(6):43-46. 被引量：5
7王伟东.声音的特征分类在新能源汽车主动发声设计中的应用[J].上海汽车,2020(3):6-9. 被引量：2
8王鑫,左乐,施振华,苏成悦,罗文俊,任开众,陈玉怀.GStreamer音视频传输系统研究与实现[J].单片机与嵌入式系统应用,2020,20(9):6-10. 被引量：4
9朱宪宇,熊婕,李庆先,刘良江,向德,王晋威.无线通信通话语音质量测量试验装置设计[J].计量技术,2020(6):36-40.
10赵志宇,贺学剑.融合LPC和MFCC特征的前馈神经网络短语音识别[J].长江信息通信,2023,36(11):171-174.

同被引文献18

1张汝波,刘冠群,吴俊伟,吕西宝.移动机器人语音控制技术研究与实现[J].华中科技大学学报（自然科学版）,2013,41(S1):348-351. 被引量：8
2吴红卫,吴镇扬,赵力.基于多窗谱的心理声学语音增强[J].声学学报,2007,32(3):275-281. 被引量：12
3刘杰,董金明.RS码在无线高保真音频传输系统中的应用[J].现代电子技术,2007,30(15):19-21. 被引量：1
4项慨,胡瑞敏,曾园园.基于无线传感网的音频编码技术研究[J].武汉理工大学学报（信息与管理工程版）,2011,33(6):909-912. 被引量：3
5彭雨晨,王忠.多窗谱估计的语音增强减法研究[J].计算机工程与应用,2012,48(19):114-118. 被引量：1
6马小珩,王秀美,陈友凤.蓝牙技术在音频/视频设备中的应用[J].无线电工程,2001,31(12):32-36. 被引量：1
7刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：67
8韩伟,张雄伟,闵刚,张启业.基于感知掩蔽深度神经网络的单通道语音增强方法[J].自动化学报,2017,43(2):248-258. 被引量：18
9李艳生,杨美美,芦娜,姜雪英,张毅.同心连接器的力学性能测试技术和系统研究[J].仪器仪表学报,2017,38(2):328-335. 被引量：6
10刘斌,陶建华.联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法[J].信号处理,2017,33(3):268-272. 被引量：11

引证文献4

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：13
2姚远,李亚伟,白天皓.改进的多窗谱谱减法语音增强研究[J].电子测试,2019,0(14):40-43. 被引量：6
3陈志博,王思雨,刘远泽,王国栋,耿卫东.一种基于改进多带谱减法的低信噪比语音识别方法[J].南开大学学报（自然科学版）,2022,55(6):58-61. 被引量：2
4卫文港,董桂官,刘鑫楠,邢广鑫.高清无线音频终端产品质量分析[J].电声技术,2024,48(2):144-149.

二级引证文献21

1郭亚齐,王鉴,韩星程,韩焱,王中正.基于CDAE-LMSAF的水下目标辐射信号增强[J].电子测量技术,2023,46(19):165-170.
2卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
3王一海.一种改进型谱减法的电子商务语音噪声去噪方法研究[J].信息化研究,2020,46(2):21-25.
4毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176.
5夏伦腾,张莉,吴飞.基于物联网技术的宠物防丢可穿戴设备系统[J].电子技术应用,2021,47(2):28-32. 被引量：3
6于金星,易茂祥,鲁迎春,宋晨钰,梁华国.L-N系统智能电气终端监控无线扩展[J].电子测量技术,2020,43(24):151-157. 被引量：1
7缪文南.基于单片机的肺活量测试仪设计[J].国外电子测量技术,2021,40(3):137-141.
8熊新中,万生鹏,刘恒,尹玺,肖登,董德壮,孙继周.直线型Sagnac光纤语音传感器及语音降噪的研究[J].激光与光电子学进展,2021,58(11):92-98. 被引量：2
9李亚文,黄乐乐,张文奕.一种煤矿井下环境安全勘测仿生机器人的设计[J].微型电脑应用,2021,37(11):117-120. 被引量：2
10张凤芹.采摘机器人语音识别系统设计——基于英语词汇整合和WAP平台[J].农机化研究,2022,44(5):223-226. 被引量：3

1陈国,胡修林,张蕴玉,朱耀庭.语音质量客观评价方法研究进展[J].电子学报,2001,29(4):548-552. 被引量：51
2李薇,胡智奇,尚秋峰,戚银城.语音质量客观评价方法的研究[J].电力系统通信,2009,30(4):64-67. 被引量：11
3于云,周伟栋.基于压缩感知的鲁棒性说话人识别参数研究[J].计算机技术与发展,2016,26(3):18-22. 被引量：1
4王榕.中央电视台节目质量评测管理系统设计[J].现代电视技术,2017(2):116-120. 被引量：1
5朱石争,周祚峰.利用互带能量和小波变换进行图像融合[J].计算机工程与应用,2009,45(14):164-166. 被引量：1
6马运杰,朱琦.噪声环境下基于稀疏表示的说话人识别[J].南京邮电大学学报（自然科学版）,2015,35(1):60-65. 被引量：2
7潘俊兰,谭华,肖熙.基于音频子带能量动态范围的快速音频检索[J].电声技术,2009,33(10):66-68.
8凌渝.基于PESQ算法的语音质量客观评价方法研究[J].警察技术,2011(5):30-32. 被引量：4
9支持CDR的测试解决方案[J].今日电子,2015,0(9):70-70.
10陆慧娟.用FFT测量音频信号失真度的误差研究[J].科技通报,1998,14(4):270-275. 被引量：4

华中科技大学学报（自然科学版）

2016年第7期

浏览历史

内容加载中请稍等...

复杂环境下基于准干净语音的音质评价方法被引量：4

参考文献18

二级参考文献25

共引文献12

同被引文献18

引证文献4

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

复杂环境下基于准干净语音的音质评价方法 被引量：4

参考文献18

二级参考文献25

共引文献12

同被引文献18

引证文献4

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

复杂环境下基于准干净语音的音质评价方法被引量：4