一种基于感知特征动态失真度量的语音质量评估算法被引量：3

Speech Quality Evaluation Algorithm Based on Dynamic Distortion Measurement of Perception Characteristics

下载PDF

导出

摘要实现一种基于语音感知特征参数动态规整失真度量的客观侵入式语音质量评估算法,该算法分为特征提取、失真度量、MOS映射三个步骤。算法的创新在于:特征提取过程中选取更能表征语音实质的GFCC参数取代传统的LPC、LPCC、MFCC、IMFCC等参数,在失真度量过程中选用动态规整距离取代传统的平均欧式距离,MOS映射时对映射函数进行修正以防止出现坏值而影响算法性能。文章详细介绍了算法的原理,在实现算法的基础上从相关度和偏离误差等指标对算法性能进行衡量,结果证明算法性能良好。 This paper realizes an intrusive objective speech quality evaluation algorithm based on dynamic distorhon measurement of speech perception characteristic parameteJ：s. The key steps of this algorithm（GFCCD_MOS） is feature extraction of Gammatone Frequency Cepstrum Coefficient, distortion measurement by Dynamic Time Warping and MOS-Mapping. This paper introduces the detail principle and measured the algorithm performance according to some indicators such as relevance and deviation error. The simulation results show the good performance of GFCCD_MOS.

作者张来洪邱波刘红玉

机构地区武汉大学电子信息学院

出处《自动化技术与应用》 2017年第4期1-4,11,共5页 Techniques of Automation and Applications

关键词语音质量评估 GFCC 动态规整 MOS映射 speech quality evaluation Gammatone Frequency Cepstrum Coefficient dynamic warping MOS-Mapping

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1陈国,胡修林,张蕴玉,朱耀庭.语音质量客观评价方法研究进展[J].电子学报,2001,29(4):548-552. 被引量：51
2白燕燕,苏静.基于听觉特性的语音特征参数提取方法研究[J].自动化技术与应用,2015,34(4):40-43. 被引量：4
3王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
4杨洁,康宁.动态时间规整DTW算法的研究[J].科技与创新,2016(4):11-12. 被引量：10
5尹伟,易本顺,吴丹青.一种基于非均匀谱系数和GMM的语音质量评估方法[J].电路与系统学报,2010,15(4):104-109. 被引量：2
6陈明义,孙冬梅,何孝月.基于改进MFCC语音特征参数的语音质量评估的研究[J].电路与系统学报,2009,14(3):111-116. 被引量：5

二级参考文献38

1鄢田云,云霞,靳蕃,朱庆军.RBF神经网络及其在基于输出的客观音质评价中的应用[J].电子学报,2004,32(8):1282-1285. 被引量：7
2张军,张德运,傅鹏.一种改进的心理声学语音质量客观评价算法[J].微电子学与计算机,2007,24(3):203-206. 被引量：6
3丁瑾,钟涛,胡健栋.话音质量的一种新的评价方法[J].电子学报,1997,25(4):6-9. 被引量：5
4ITU-T Recommendation P.862.Perceptual evaluation of speech quality (PESQ):An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs[S].2001,2.
5KUBICHEK R.Mel-cepstral distance measure for objective speech quality assessment[A].Proc.IEEE Pacific Rim Conference on Communications,Computers,and Signal Processing.Piscatawey:IEEE Press[C].1993.125-128.
6王金甲.噪声环境下鲁棒性文本自由说话人辨认系统的研究.燕山大学学报,2003,(3):15-17.
7Hermansky H,Morgan N.RASTA processing of speech[J].IEEE Trans on Speech and Audio Processing,1994,22(4):578-589.
8S Furui. Digital Speech Processing, Synthesis, and Recognition [ M]. New York: Marcel Dekker, 2001.
9H Gish, M Schmidt. Text-independent speaker identification [ J]. IEEE Signal Proc, 1994,11 (4): 18 - 32.
10D A Reynolds, et al. The SuperSID project: Exploiting high- level information for high-accuracy speaker recognition [ A ]. International Conference on Acoustics, Speech, and Signal Processing[ C]. Hong Kong, China: IEEE, 2003.4:784 - 787.

共引文献92

1贾冲,孙浩海,吴其前,张雄伟.语音音质客观评价系统的实现[J].解放军理工大学学报（自然科学版）,2004,5(3):33-37. 被引量：1
2鄢田云,云霞,靳蕃,朱庆军.RBF神经网络及其在基于输出的客观音质评价中的应用[J].电子学报,2004,32(8):1282-1285. 被引量：7
3刘广建 ,王伯昶 ,薛磊 .通信对抗系统干扰效能度量[J].无线电工程,2005,35(3):35-37. 被引量：9
4姜甜,窦维蓓.音频质量客观评价方法的综合与实现[J].电声技术,2005,29(7):41-44. 被引量：3
5吴耀文,王平,徐昶.VoIP语音评价方法综述[J].舰船电子工程,2006,26(1):44-46. 被引量：6
6张军,张德运.分组网络环境下的实时语音质量客观评价[J].西安交通大学学报,2006,40(8):936-939. 被引量：2
7陈华伟,靳蕃.基于感知模型的美尔谱失真测度[J].西南交通大学学报,2006,41(6):723-728. 被引量：4
8许嵩,李志忠.声学告警的工效学研究[J].人类工效学,2007,13(1):63-65. 被引量：3
9卢欣,叶成荫,吴旭翔,黄永强.一种基于LSB的信息隐藏方法设计[J].职业时空,2007,3(03S):68-69.
10杨云升,陈伟.逆云模型在语音音质评估中的应用[J].电声技术,2007,31(5):52-55. 被引量：2

同被引文献22

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：13
2戴小溪,刘爱伦.基于Levinson-Durbin算法的变采样周期调度[J].微计算机信息,2012(7):19-21. 被引量：2
3张亚红,李志梅,覃科.基于混沌和LWT-SVD的盲信息隐藏算法[J].西安航空学院学报,2013,31(5):53-57. 被引量：2
4吴秋玲,吴蒙.基于小波变换的语音信息隐藏新方法[J].电子与信息学报,2016,38(4):834-840. 被引量：17
5张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12
6林海波,王可佳.一种新的听觉特征提取算法研究[J].南京邮电大学学报（自然科学版）,2017,37(2):27-32. 被引量：11
7蒋晓丹,范航宇,陆哲明.基于Logistic混沌映射和IWT-SVD量化的盲鲁棒水印算法[J].传感器与微系统,2018,37(2):131-135. 被引量：9
8缑新科,徐高鹏.基于Gabor滤波的语音识别鲁棒性研究[J].计算机与现代化,2018(5):20-24. 被引量：2
9刘翔,孙静,赵洋,王威廉.基于MFCC的心音信号特征提取及识别研究[J].电子测量技术,2018,41(2):1-5. 被引量：7
10杨明极,张贵山.基于栈式自动编码机的语音质量评价方法[J].小型微型计算机系统,2018,39(10):2134-2137. 被引量：3

引证文献3

1陆诗依,高勇.在小波域中实现的动态嵌入音频隐藏算法[J].传感器与微系统,2018,37(12):131-135. 被引量：1
2毛文青,管业鹏.基于LPBMFCC的文本无关说话人识别[J].电子测量技术,2020,43(19):169-176.
3傅强,李贵民,吴岳洲.基于BP神经网络的管制语音质量评价方法[J].航空计算技术,2023,53(3):1-5.

二级引证文献1

1韩萌,李晖,张仔航.一种改进的音频隐写技术[J].信息技术与信息化,2023(7):157-160.

1张军,李学斌.一种基于DTW的孤立词语音识别算法[J].计算机仿真,2009,26(10):348-351. 被引量：4
2包晓刚,胡剑凌,徐盛.基于巴克谱的语音质量评估算法研究[J].数据采集与处理,2004,19(1):16-20. 被引量：2
3谢迎春,于湘珍,刘建平,张卫华.基于多特征有效组合的说话人识别[J].现代电子技术,2005,28(9):68-70. 被引量：5
4沈向余,李伟华,赖昌材.利用模糊积分进行H.264/AVC的时间错误隐藏[J].计算机应用,2007,27(B06):362-363.
5谢迎春,刘建平,于晓琳.基于改进的时间动态规整算法的多特征组合的说话人辨认方法研究[J].计算机与信息技术,2006(11):1-3.
6马骏,刘桢,刘赛男,王美青,程威,赵琪.嵌入式语音识别系统[J].科技信息,2011(6):130-131. 被引量：1
7秦怀斌,李道亮,郭理,梁斌,邵明文.基于复杂网络的软件体系结构复杂性度量方法[J].微电子学与计算机,2013,30(2):5-8. 被引量：7
8李正友,李天伟,黄谦,隋振庚.一种新的VDR浊语音检测方法[J].计算机应用研究,2013,30(8):2461-2463.
9王丽,武淑红,张刚,李付江.基于SSIM和SAD的AVS帧内预测模式改进算法[J].电视技术,2013,37(1):15-17.
10茅正冲,龚熙.基于压缩感知的语音增强识别系统[J].计算机应用研究,2016,33(2):450-453. 被引量：2

自动化技术与应用

2017年第4期

浏览历史

内容加载中请稍等...

一种基于感知特征动态失真度量的语音质量评估算法被引量：3

参考文献6

二级参考文献38

共引文献92

同被引文献22

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于感知特征动态失真度量的语音质量评估算法 被引量：3

参考文献6

二级参考文献38

共引文献92

同被引文献22

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于感知特征动态失真度量的语音质量评估算法被引量：3