噪声鲁棒性说话人识别语音高频加权MFCC提取被引量：15

High frequency weighted MFCC extraction for noise robust speaker verification

下载PDF

导出

摘要本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而保留更多高次谐波信息。将语音频谱能量高频部分进行加权,则可使语音增强,提高语音鲁棒性。该方法被用于基音同步预处理MFCC参数提取中,并进行了说话人确认实验。实验结果表明,即使在信噪比较低的情况下,该方法都会在一定程度上提高多种噪声环境下的说话人确认识别率。 This paper proposes a high frequency weighted MFCC extraction method to improve the performance of speaker verification in noise conditions. As the Mel frequency has a logarithmic relationship with linear frequency, spectral resolution in high frequency domain would decline. Frames of purely periodic speech signal can avoid harmonic leakage, and more high frequency information would be reserved. To get speech enhancement, high frequency energy amplitude weighted method is proposed. This method was applied in pitch synchronous preproeessing MFCC feature extraction, and speaker verification experiments were conducted. The results show that the recognition rates are improved in several kinds of noise environments even when the SNR is low.

作者陈迪龚卫国李波

机构地区重庆大学光电技术及系统教育部重点实验室重庆大学现代物理中心材料科学与工程博士后流动站

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第3期668-672,共5页 Chinese Journal of Scientific Instrument

关键词高频加权说话人确认基音同步鲁棒性 MFCC high frequency weighted speaker verification pitch synchronous robust MFCC

分类号 TP192.3 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1GALES M F J. Predictive model-based compensation schemes for robust speech recognition [ J ]. Speech Communication, 1998, 25 ( 1-3 ) :49-74.
2WEINSTEIN E, OPPENHEIM A V, FEDER M, et al. Iterativeand sequential algorithms for multisensor signal enhancement [ C ]. IEEE Trans. on Signal Processing, 1994,42(4) : 846-859.
3XU T, CAO Z G. Combination of feature weight and speech enhancement for robust ASR at low SNRs [ C ]. Proceedings of IEEE TENCON'02, 2002: 441-444.
4DAVIES S B, MERMELSTEIN P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences [ C ]. IEEE Trans. Acoustics, Speech and Signal Processing, 1980, ASSP-28 (4) : 375-366.
5KIM S, ERIKSSON T. A pitch synchronous feature extraction method for speaker recognition [ C ]. IEEE, Acoustics, Speech and Signal Processing Proceedings, 2004, 1 : 405-408.
6易克初田斌付强.语音信号处理[M].北京:国防工业出版社,2003..
7YANG L P, GONG W G. Multi-SNR GMMs-based noiseRobust speaker verification using 1/f "Noises" [ C ]. IEEE, The 18th International Conference on Patter Recognition, 2006, 4: 241-244.
8鲍长春,樊昌信.基于归一化互相关函数的基音检测算法[J].通信学报,1998,19(10):27-31. 被引量：42

共引文献51

1夏殿松,胡淼,洪夏俊.一种基于AMDF和ACF的基音周期提取算法研究[J].军事通信技术,2009,30(1):27-31. 被引量：5
2王艳芬,于洪珍,刘卫东,郑晓红.基于时域自相关平方函数的基音周期估计[J].计算机工程与应用,2004,40(31):83-85. 被引量：8
3柏静,韦岗.一种基于线性预测与自相关函数法的语音基音周期检测新算法[J].电声技术,2005,29(8):43-46. 被引量：14
4杨茂繁,赵修斌,张斌.基于TMS320F2812的外场信号检测研究[J].微处理机,2005,26(5):89-90.
5应娜,赵晓晖.一种高精度改进型SHR基音检测算法[J].通信学报,2005,26(12):86-92. 被引量：2
6唐升,侯榆青,李岩,克兢.一种新的数字语音通信中说话人身份认证方法[J].西北大学学报（自然科学版）,2006,36(1):46-49.
7乔晓艳,李刚,林凌,贾莲凤.脑电信号与经穴输入信号相关分析的实验研究[J].生物医学工程学杂志,2006,23(6):1218-1221.
8罗亚飞,鲍长春.基于DCT分带谱熵与信号分解的高精度基音检测算法[J].电子学报,2007,35(1):13-22. 被引量：5
9赵静,罗兴国,蔡文涛.噪声环境下语音信号的基音检测[J].电声技术,2007,31(3):54-56. 被引量：5
10温兆麟,陈新,郑德涛.用快速归一化互相关进行缺陷检测[J].广州航海高等专科学校学报,2006,14(2):29-31. 被引量：2

同被引文献113

1张重远,罗世豪,岳浩天,王博闻,刘云鹏.基于Mel时频谱-卷积神经网络的变压器铁芯声纹模式识别方法[J].高电压技术,2020,46(2):413-423. 被引量：70
2王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
3HU Jie, ZHANG Yujun, LI Peng, WANG Hui, HUANG Lan & HU YuanzhongState Key Laboratory of Tribology, Tsinghua University, Beijing 100084, China,Department of Physics, Tsinghua University, Beijing 100084, China,College of Chemistry and Molecular Engineering, Peking University, Beijing 100871, China.Micro-mechanical analysis of dynamic processes of nanomanipulation[J].Science China(Physics,Mechanics & Astronomy),2004,47(z1):88-92. 被引量：28
4刘广建,王伯昶.基于相关系数的语音通信干扰效果评估[J].电子对抗,2004(3):28-31. 被引量：4
5樊桂花,唐斌.基于小波变换的语音基音周期鲁棒性检测[J].信号处理,2004,20(4):365-368. 被引量：8
6张宇波.基于信号处理的声音模式识别过程及方法研究[J].计算机仿真,2004,21(9):134-137. 被引量：6
7罗宇,杜利民.基于概率加权平均的Mel子带特征重建算法[J].电子学报,2004,32(10):1738-1741. 被引量：1
8武妍,金明曦,王洪波.基于KL-小波包分析的文本无关的说话人识别[J].计算机工程与应用,2005,41(4):26-28. 被引量：6
9刘雅琴,周炜.基于小波变换的说话人语音特征参数提取[J].河南科技大学学报（自然科学版）,2005,26(4):44-46. 被引量：10
10李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25

引证文献15

1邱政权,范小春,王俊年.基于维纳滤波和混合模型的说话人识别[J].仪器仪表学报,2009,30(7):1436-1440. 被引量：5
2栾少文,龚卫国.公共场所典型异常声音的特征提取[J].计算机工程,2010,36(7):208-210. 被引量：16
3王彪.一种改进的MFCC参数提取方法[J].计算机与数字工程,2012,40(4):19-21. 被引量：5
4王再欢,唐云建,韩鹏.一种利用声音识别的森林盗伐检测方法[J].计算机工程与应用,2012,48(30):216-219. 被引量：3
5孙战先,储飞黄,王江,汪海兵.通信接收机干扰容限自动测量方法研究[J].电子测量与仪器学报,2012,26(11):999-1004. 被引量：6
6李素平.基于相对谱滤波的MFCC参数提取[J].电子世界,2013(13):104-104.
7安冬,荣超群,杨丹,王骄.基于PSOA聚类和KMP算法的说话人识别方法[J].仪器仪表学报,2013,34(6):1306-1311. 被引量：8
8李晶皎,安冬,杨丹,王骄.CPSO聚类和KMP相结合的说话人识别方法[J].小型微型计算机系统,2013,34(7):1699-1702.
9李响,谭南林,李国正,郭然.一种应用语音多特征检测驾驶疲劳的方法[J].仪器仪表学报,2013,34(10):2231-2237. 被引量：15
10张贺,沈天飞,滕秋霞.小词汇量孤立词语音识别系统多种特征组合参数的选择方法研究[J].电子测量技术,2015,38(3):48-53. 被引量：7

二级引证文献116

1刘元,匡文凯,苏盛,李彬.基于双通道能量差的环网柜局放信号消噪方法[J].仪器仪表学报,2021,42(2):218-227. 被引量：5
2杜晓冬,滕光辉,刘慕霖,赵雨晓,周振宇,祝鹏飞.基于轻量级卷积神经网络的种鸡发声识别方法[J].农业机械学报,2022,53(10):271-276. 被引量：5
3韩丁,新吉乐,王亮,王亚欣,李厅霞,郭瑛.声学监测技术在家畜福利化养殖中的发展应用[J].内蒙古农业大学学报（自然科学版）,2023,44(5):89-100.
4卢洵波,李昕.特征融合的VAD方法在语音识别系统中的应用[J].电子测量技术,2020(7):129-136. 被引量：2
5朱俊敏.羊咳嗽的治疗方法[J].兽医导刊,2019(2):153-153.
6邱政权,范小春,王俊年.基于动态环境下的说话人识别[J].科学技术与工程,2010,10(2):498-500.
7李伟红,汤海兵,龚卫国.公共场所异常声源定位中时延估计方法研究[J].仪器仪表学报,2012,33(4):750-756. 被引量：16
8王再欢,唐云建,韩鹏.一种利用声音识别的森林盗伐检测方法[J].计算机工程与应用,2012,48(30):216-219. 被引量：3
9刘付喜,钱苏翔,曹坚.基于遗传算法的BP神经网络在声音智能监控中应用[J].常州大学学报（自然科学版）,2012,24(3):70-74. 被引量：4
10刘付喜,曹坚,邹斌斌.基于改进的神经网络异常声音自动识别系统研究[J].软件导刊,2013,20(4):120-122. 被引量：1

1王明,肖熙.变帧长和变帧率在说话人确认中的应用[J].计算机应用,2007,27(8):2051-2052.
2林江云,张彩虹,黄关维.嵌入式基于GMM说话人确认系统的研究[J].福建电脑,2007,23(4):127-127.
3刁志蕙,冯玉田,王瑞,毕超,李园辉.基于稀疏表示的声频目标识别方法研究[J].电声技术,2016,40(5):31-34.
4陈勇,屈志毅,刘莹,酒康,郭爱平,杨志国.语音特征参数MFCC的提取及其应用[J].湖南农业大学学报（自然科学版）,2009,35(10X):106-107. 被引量：11
5王彪.一种改进的MFCC参数提取方法[J].计算机与数字工程,2012,40(4):19-21. 被引量：5
6林静,贺前华,李新超,杨继臣.基于高频加权CQT谱的音符起始点检测[J].计算机工程与设计,2015,36(9):2485-2489. 被引量：3
7崔伟,李淑东.神经网络在齿轮箱故障诊断中的应用[J].仪器仪表与分析监测,2013(1):8-11. 被引量：2
8亓秀燕,尹义龙,骆功庆,刘懋.基于频谱能量的指纹分类[J].计算机工程与设计,2008,29(8):2010-2013. 被引量：1
9杨江,陆源,李治.仿真模型预测能力的度量方法研究[J].仪器仪表学报,2002,23(z2):465-466.
10尤东升,夏加明,孙金行.基于西门子840D的加工稳定性分析与参数优化[J].机械制造,2012,50(5):24-28. 被引量：1

仪器仪表学报

2008年第3期

浏览历史

内容加载中请稍等...

噪声鲁棒性说话人识别语音高频加权MFCC提取被引量：15

参考文献8

共引文献51

同被引文献113

引证文献15

二级引证文献116

相关作者

相关机构

相关主题

浏览历史

噪声鲁棒性说话人识别语音高频加权MFCC提取 被引量：15

参考文献8

共引文献51

同被引文献113

引证文献15

二级引证文献116

相关作者

相关机构

相关主题

浏览历史

噪声鲁棒性说话人识别语音高频加权MFCC提取被引量：15