弯折滤波器在说话人识别的鲁棒特征提取中的应用被引量：1

Warped Filter Banks Applied in Robust Feature Extraction Method for Speaker Recognition

下载PDF

导出

摘要针对噪声环境中说话人识别性能急剧下降的问题.提出了一种用于说话人识别的鲁棒特征提取的方法.采用弯折滤波器组(Warped filter banks,WFBS)来模拟人耳听觉特性,将立方根压缩算法、相对谱滤波技术(RASTA)、倒谱均值方差归一化算法(CMVN)引入到鲁棒特征的提取中.在高斯混合模型(GMM)下进行仿真,实验结果表明该方法提取的特征参数在鲁棒性和识别性能上均优于MFCC特征参数和CFCC特征参数. The performance of the speaker recognition system degrades drastically in the noisy environment. A robust feature extraction method for speaker recognition is proposed in this paper. Warped filter banks（WFBS） are used to simulate the human auditory characteristics. The cubic root compression method, relative spectral filtering technique（RASTA） and the cepstral mean and variance normalization algorithm（CMVN） are introduced into the robust feature extraction. Subsequently, simulation experiment is conducted based on Gaussian mixes model（GMM）. The experimental results indicate that the proposed feature has better robustness and recognition performance than the mel cepstral coefficients（MFCC） and cochlear filter cepstral coefficients（CFCC）.

作者邓蕾高勇

机构地区四川大学电子信息学院

出处《计算机系统应用》 2017年第12期227-232,共6页 Computer Systems & Applications

关键词说话人识别弯折滤波器组鲁棒性 speaker recognition warped filter banks robusmess

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1曹龙涛,李如玮,鲍长春,吴水才.基于噪声估计的二值掩蔽语音增强算法[J].计算机工程与应用,2015,51(17):222-227. 被引量：4

二级参考文献17

1Alc~ntara J I,Moore B C J,Kfihnel V, et al.Evaluation of the noise reduction system in a commercial digital hearing aid: evaluaci6n del sistema de reducci6n de ruido en un auxiliar auditivo digital comercial[J].InternationalJournal of Audiology, 2003,42( 1 ) : 34-42.
2Lai Y H, Su Y C,Tsao Y, et al.Evaluation of Generali- zed Maximum A Posteriori spectral Amplitude (GMAPA) speech enhancement algorithm in hearing aids[C]//2013 IEEE 17th International Symposium on Consumer Elec- tronics (ISCE) ,2013:245-246.
3Moore B C J.Cochlear hearing loss:physiological, psy- chological and technical issues[M].[S.1.] :Wiley-Interscience, 2007.
4Levitt H.Noise reduction in hearing aids:an overview[J]. Journal of Rehabilitation Research and Development, 2001,38(1) : 111-121.
5VenemaTH.实用助听器原理与技术[M].北京:人民军医出版社,2013.
6Fukane A R, Sahare S L.Enhancement of noisy speech signals for hearing aids[C]//2011 International Confer- ence on Communication Systems and Network Technolo- gies (CSNT),2011:490-494.
7~lvarez L,Alexandre E,Llerena C,et al.Speech enhance- ment in noisy environments in hearing aids driven by a tailored gain function based on a Gaussian mixture model[C]//Artificial Intelligence and Soft Computing.Ber- lin/Heidelberg : Springer, 2013 : 503-514.
8Moore B C J,Moore B C.An introduction to the psy- chology of hcaring[M].San Diego-Academic Press,2003.
9Brungart D S,Chang P S, Simpson B D,et al.Isolating the energetic component of speech-on-speech masking with ideal time-frequency segregation[J].The Journal of the Acoustical Society of America,2006, 120.
10Li N, Loizou P C.Factors influencing intelligibility ofideal binary-masked speech: implications for noise reduc- tion[J].The Journal of the Acoustical Society of America, 2008,123.

共引文献3

1吴进,赵隽,李乔深.基于维纳过滤的IMCRA算法[J].西安邮电大学学报,2017,22(5):73-77. 被引量：2
2李如玮,张永亚,潘冬梅,杨登才.噪声环境下基于信噪比的多通道自适应频响补偿算法[J].北京生物医学工程,2019,38(1):42-51. 被引量：1
3卢铃,佘恺,蔡炜,唐奇,谢银娥,武帅兵.变电站站界噪声抗干扰测量方法[J].湖南电力,2021,41(6):36-40. 被引量：1

同被引文献13

1章熙春,曹燕,张军,韦岗.语音MFCC特征计算的改进算法[J].数据采集与处理,2005,20(2):161-165. 被引量：6
2魏丹芳,李应.基于MFCC和加权动态特征组合的环境音分类[J].计算机与数字工程,2010,38(2):7-10. 被引量：4
3吕霄云,王宏霞.基于MFCC和短时能量混合的异常声音识别算法[J].计算机应用,2010,30(3):796-798. 被引量：29
4鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：16
5甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报（自然科学版）,2001,37(3):371-378. 被引量：74
6张怡然,白静,王力.基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法[J].科学技术与工程,2014,22(19):253-256. 被引量：6
7唐宗渤,周萍,王茂蓉,刘继锦.反蓄意模仿说话人识别系统中特征参数提取的研究[J].微型机与应用,2016,35(12):18-20. 被引量：1
8茅正冲,王俊俊.基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统[J].南京理工大学学报,2018,42(1):82-88. 被引量：4
9沈凌洁,王蔚.基于融合特征的短语音汉语声调自动识别方法[J].声学技术,2018,37(2):167-174. 被引量：3
10魏君颖,魏维.说话人识别特征提取算法改进[J].成都信息工程学院学报,2014,29(S1):67-70. 被引量：1

引证文献1

1王家盛,郭其威,吴松,马建敏.基于特征相对贡献度对加权Mel倒谱的改进[J].声学技术,2021,40(3):408-414. 被引量：4

二级引证文献4

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：8
2邬友朋,赵金龙,贾中营.一种基于KNN/CNN的供热客服音频分类方法[J].电力大数据,2021,24(7):56-66. 被引量：1
3王学松,王世刚,郭毅峰.基于EEMD的融安方言语音合成算法研究[J].传感器世界,2022,28(6):25-29. 被引量：1
4席青云,孙同日,陶佰睿,杨文博,苗凤娟.PCA-VQ融合降维的SMO-SVM说话人识别研究[J].传感技术学报,2023,36(2):275-279.

1刘倩,李时.细菌趋药性算法在说话人识别中的应用[J].宿州学院学报,2017,32(11):101-104.
2魏爽.一种利用人工神经网络优化语音识别的方法[J].数字技术与应用,2017,35(10):228-229. 被引量：3
3冯月芹,郝雯超,陈义,王蕾,李春光.说话人识别算法鲁棒性研究[J].南京工程学院学报（自然科学版）,2017,15(3):60-66. 被引量：2
4赵萦银.孪生姐妹:平方根与立方根[J].初中生世界（八年级）,2017,0(12):50-50.
51100kV交流滤波器组断路器成功研制[J].电世界,2017,58(12):56-56.
6科大讯飞语音云打造语音声纹识别[J].中国信息安全,2010,0(11):82-82. 被引量：1
7米妍,王光明.整体性数学思维方式视野下的教材阅读——基于章建跃先生对《实数》一章的教材分析[J].数学通报,2017,56(10):8-12. 被引量：19
8Mohammad A.Ganjali,Sadegh Sadeghian.Tensor Fields on Self-Dual Warped AdS_3 Background[J].Communications in Theoretical Physics,2017,67(10):447-454.
9潇荷.印度人的会计(下)[J].武汉财会,1985(10).
10胡凤霞,王瑛,杨海兵,王建书,吴建兰,毛洁.对2007年至2016年苏州市职业性噪声聋发病情况的分析[J].当代医药论丛,2017,15(20):33-34. 被引量：13

计算机系统应用

2017年第12期

浏览历史

内容加载中请稍等...

弯折滤波器在说话人识别的鲁棒特征提取中的应用被引量：1

参考文献1

二级参考文献17

共引文献3

同被引文献13

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

弯折滤波器在说话人识别的鲁棒特征提取中的应用 被引量：1

参考文献1

二级参考文献17

共引文献3

同被引文献13

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

弯折滤波器在说话人识别的鲁棒特征提取中的应用被引量：1