基于Gammatone滤波器组的听觉特征提取被引量：28

Auditory Feature Extraction Based on Gammatone Filter Bank

下载PDF

导出

摘要目前主流说话人特征参数在噪声环境中的鲁棒性较差。为此,提出一种可用于说话人识别的听觉倒谱特征系数。分析人耳听觉模型的工作机理,采用Gammatone滤波器组代替传统的三角滤波器组模拟人耳耳蜗的听觉模型,用指数压缩代替固定的对数压缩,模拟人耳听觉模型处理信号的非线性特性。在基于高斯混合模型分类器的识别算法下进行仿真实验,结果表明,该听觉特征具有比梅尔频率倒谱系数和线性预测倒谱系数更好的抗噪声能力。 Aiming at the problem that speaker＇s feature coefficients have poor robustness in noise environment, this paper proposes an auditory cepstral coefficient for speaker recognition. It analyzes the working mechanism of the human auditory model, simulates the auditory model of human ear cochlea by Garnmatone filter banks replaces the traditional triangular filter banks. Based on the nonlinear signal processing capability of human auditory model, exponential compression is used instead of the fixed logarithm compression. Simulation experiment is conducted based on Gaussian Mixed Model（GMM） recognition algorithm. Experimental results show that the auditory feature has better noise robusmess than Mel Frequency Cepstral Coefficient（MFCC） and Linear Prediction Cepstral Coefficient（LPCC）.

作者胡峰松曹孝玉

机构地区湖南大学信息科学与工程学院北京师范大学管理学院

出处《计算机工程》 CAS CSCD 2012年第21期168-170,174,共4页 Computer Engineering

关键词说话人识别特征提取 Gammatone滤波器听觉模型倒谱系数鲁棒性 speaker recognition feature extraction Gammatone filter auditory model cepstral coefficient robustness

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
2Irino T, Patterson R D. A Dynamic Compressive Gammachirp Auditory Filterbank[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2006, 14(6): 2222-2232.
3Lyon R F, Katsiamis A G, Drakakiss E M. History and Future of Auditory Filter Models[C]//Proc. of ISCAS'10. Paris, France: Is. n.], 2010: 3809-3812.
4李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
5马元锋,陈克安,马苗,张成.一种新的可应用于声目标识别的倒谱系数[J].兵工学报,2009,30(11):1477-1483. 被引量：12
6卢小春,尹俊勋,王修信.基于听觉模型特征的与文本无关说话人识别系统[J].广西师范大学学报（自然科学版）,2010,28(2):22-26. 被引量：2
7Plack C J, Oxenham A J. Basilar-membrane Nonlinearity Estimated by Pulsation Threshold[J]. Journal of the Acoustical Society of America, 2000, 107(1): 501-507.
8Hu Yi, Loizou P C. Subjective Comparison and Evaluation of Speech Enhancement Algorithms[J]. Speech Communication, 2007, 49(7): 588-601.

二级参考文献173

1李波,王成友,杨聪,蔡宣平,张尔扬.基于语音频谱包络抽取的MFCC算法[J].国防科技大学学报,2004,26(4):42-45. 被引量：4
2陆振波,章新华,胡洪波.水中目标辐射噪声的听觉特征提取[J].系统工程与电子技术,2004,26(12):1801-1803. 被引量：19
3彭圆,王晟,王科俊,李雪耀,林良骥,林正青,王建文.感知线性预测在水下目标分类中的应用研究[J].声学学报,2006,31(2):146-150. 被引量：16
4李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
5Tucker S, Brown G J. Classification of transient sonar sounds using perceptually motivated features [J ]. IEEE Journal of Oceanic Engineering, 2005, 30(3) : 588- 600.
6Parks T W, Weisburn B A. Classifichtion of whale and ice sounds with a cochlear model[J]. ICASSP-92, 1992, 2:481 -484.
7Wan Wanggen. Robust speech recognition based on the secondorder difference cochlear model[C]//Proceedings of 2001 International Symposium on Intelligent multimedia, Video and Speech Processing. Hong Kong: IEEE, 2001:543-546.
8Strope B, Alwan A. A model of dynamic auditory perception and its application to robust word recognition[J ]. IEEE Trans on Speech and Audio Processing, 1997, 5(5) : 451 - 464.
9Moore B C J, Glasberg B R, Baer T. A model for the prediction of thresholds, loudness, and partial loudness [ J ]. J Audio Eng Soc, 1997, 45(4): 224-239.
10Patterson R D, Unoki M, Irino T. Extending the domain of center frequencies for the compressive Gammachirp auditory filter[J]. J Acoust Soc Am, 2003, 114(3) : 1529- 1542.

共引文献56

1刘辉,杨俊安,王一,蔡学良.基于改进测地距离的等度规映射及其在声目标特征提取中的应用[J].兵工学报,2012,33(10):1178-1184. 被引量：2
2马元锋,陈克安,王娜,郑文.听觉模型输出谱特征在声目标识别中的应用[J].声学学报,2009,34(2):142-150. 被引量：20
3马元锋,陈克安,马苗,张成.一种新的可应用于声目标识别的倒谱系数[J].兵工学报,2009,30(11):1477-1483. 被引量：12
4MA Yuanfeng,CHEN Ke'an,SHI Fang.Application of auditory spectrum-based features into acoustic target recognition[J].Chinese Journal of Acoustics,2010,29(1):33-44.
5马元锋,陈克安,王云山,马苗.自适应听觉感知时频分析模型[J].声学学报,2010,35(4):393-402. 被引量：1
6刘辉,杨俊安,王一.基于去相关邻域保持判别投影的声目标特征提取[J].电子测量与仪器学报,2010,24(10):905-910. 被引量：2
7刘辉,杨俊安,周志增.听觉模型倒谱系数及其在声目标识别中的应用[J].应用科学学报,2011,29(1):51-55. 被引量：1
8刘辉,杨俊安,王一.基于流形学习的声目标特征提取方法研究[J].物理学报,2011,60(7):437-443. 被引量：7
9陈斌,张连海,王波,屈丹.基于Seneff听觉谱特征的汉语连续语音声韵母边界检测[J].声学学报,2012,37(1):104-112. 被引量：6
10何朝霞,潘平.基于听觉模型的说话人语音特征提取[J].微型机与应用,2012,31(1):37-39. 被引量：2

同被引文献193

1周莹,王爱红.腭裂语音的研究进展[J].医学信息（医学与计算机应用）,2014,0(14):629-630. 被引量：1
2刘红星,戴蓓蒨,陆伟.基于共振峰谐波能量的语音端点检测[J].清华大学学报（自然科学版）,2008,48(S1):754-759. 被引量：11
3高印寒,陈王锋,程鹏,李振雷,池俊成,李强.旋风分离器两相三维流场仿真[J].吉林大学学报（工学版）,2008,38(S1):177-181. 被引量：5
4赵越,赵晓晖,董婧.基于子带分解的自适应回声抵消算法[J].吉林大学学报（工学版）,2009,39(1):198-203. 被引量：3
5TANG Weilin (Harbin Shipuilding Engineering Institute, Harbin 150001).Highlight model of echoes from sonar targets[J].Chinese Journal of Acoustics,1994,13(2):131-140. 被引量：2
6庞程,李晓飞,刘宏.基于MFCC与基频特征贡献度识别说话人性别[J].华中科技大学学报（自然科学版）,2013,41(S1):108-111. 被引量：8
7纪正飚,王吉林,赵力.基于模糊K近邻的语音情感识别[J].微电子学与计算机,2015,32(3):59-62. 被引量：10
8高雨青,黄泰翼,陈韶岩.听觉模型用于语音识别以及与一般方法的比较[J].电子学报,1993,21(10):1-6. 被引量：2
9刘惠华,赵南明,方棣棠.听觉模型研究的意义与现状[J].生命科学,1993,5(2):13-15. 被引量：1
10汤渭霖.声呐目标回波的亮点模型[J].声学学报,1994,19(2):92-100. 被引量：137

引证文献28

1翟慧强,张金萍,王丹,赵艳春.听觉模型综述[J].机械工程师,2014(3):19-22. 被引量：4
2茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
3茅正冲,龚熙.基于EMD与RLS的说话人识别抗噪算法[J].计算机应用与软件,2016,33(5):231-234.
4熊冰峰,曾以成,谢小娟.一种改进的听觉特征参数应用于说话人识别[J].计算机应用,2016,36(A01):82-85. 被引量：5
5张晓丹,黄丽霞,张雪英.关于在噪声环境下语音识别优化研究[J].计算机仿真,2016,33(8):172-176. 被引量：17
6李庆先,卞昕,刘良江,朱宪宇,周鑫.基于Gammatone滤波器组的客观语音质量评估[J].计算技术与自动化,2016,35(3):76-80. 被引量：5
7林正青,邱梦然.水中目标窄带噪声识别的听觉外周模型[J].声学学报,2016,41(6):881-890. 被引量：3
8朱绍程,刘利民.低空飞行声目标特征提取技术研究[J].电声技术,2017,41(7):90-96. 被引量：2
9詹海峰,田红心,牛博,李从林.基于多分辨率高斯滤波器组的时频分析方法[J].中国电子科学研究院学报,2017,12(6):654-661. 被引量：5
10LIN Zhengqing,QIU Mengran,BA Wei.An auditory periphery model for improving narrow-band noise recognition rate of underwater targets[J].Chinese Journal of Acoustics,2018,37(3):325-340.

二级引证文献81

1王士彬,黄伟,季鸿宇,赵娜,贾浩.SAO-VMD联合包络熵特征的高压断路器故障诊断方法[J].云南电业,2023(6):1-7.
2李庆先,卞昕,刘良江,朱宪宇,周鑫.基于Gammatone滤波器组的客观语音质量评估[J].计算技术与自动化,2016,35(3):76-80. 被引量：5
3冯一帆,姜文涛.基于语音识别的智能书架设计与实现[J].软件导刊,2017,16(5):57-59. 被引量：3
4黄丽霞,王亚楠,张雪英,王洪翠.基于深度自编码网络语音识别噪声鲁棒性研究[J].计算机工程与应用,2017,53(13):49-54. 被引量：9
5张海波,周民伟,刘晓辉,胡占生.语音识别技术在医院临床的探索与应用[J].中国数字医学,2017,12(10):18-20. 被引量：2
6张海波,周民伟,刘晓辉,赵晓庆.智能语音识别技术在医院临床的探索与应用[J].中国卫生信息管理杂志,2017,14(5):660-663. 被引量：25
7罗刚,李允公,张启林,徐劲芳.基于优化听觉模型的机床工况识别方法研究[J].上海理工大学学报,2017,39(4):340-345. 被引量：1
8郭俊峰,张丽.基于改进MFCC的无人机监测方法[J].电声技术,2018,42(2):17-23. 被引量：1
9王华朋.基于听觉模型的法庭语音证据特征量化[J].中国刑警学院学报,2018(1):119-122. 被引量：6
10雷雨,吴超,王秉.人对声信号的安全认知模型构建及其应用[J].中国安全生产科学技术,2018,14(6):27-32.

1张晓丹,黄丽霞,张雪英.关于在噪声环境下语音识别优化研究[J].计算机仿真,2016,33(8):172-176. 被引量：17
2黄力.基于听觉模型的自适应水印算法设计[J].广西民族大学学报（自然科学版）,2012,18(2):41-44.
3茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
4陆振波,章新华,胡洪波.水中目标辐射噪声的听觉特征提取[J].系统工程与电子技术,2004,26(12):1801-1803. 被引量：19
5李庆先,卞昕,刘良江,朱宪宇,周鑫.基于Gammatone滤波器组的客观语音质量评估[J].计算技术与自动化,2016,35(3):76-80. 被引量：5
6安玲玲,于雷.基于高斯混合模型的心音信号识别[J].吉林大学学报（理学版）,2016,54(5):1096-1102. 被引量：5
7李世超,王永琦,吉立新,马桂航.基于听觉系统半波整流逆变化的语音恢复[J].计算机工程与设计,2007,28(13):3148-3150.
8茅正冲,王正创,龚熙.一种低信噪比下的说话人识别算法研究[J].计算机应用与软件,2014,31(12):218-220. 被引量：3
9王娜,刘政连.基于DTW的孤立词语音识别系统的研究与实现[J].九江学院学报（自然科学版）,2010,23(3):31-33. 被引量：2
10胡雯,钟西,唐向宏.基于量化频域稳健音频水印算法[J].杭州电子科技大学学报（自然科学版）,2006,26(4):9-12.

计算机工程

2012年第21期

浏览历史

内容加载中请稍等...

基于Gammatone滤波器组的听觉特征提取被引量：28

参考文献8

二级参考文献173

共引文献56

同被引文献193

引证文献28

二级引证文献81

相关作者

相关机构

相关主题

浏览历史

基于Gammatone滤波器组的听觉特征提取 被引量：28

参考文献8

二级参考文献173

共引文献56

同被引文献193

引证文献28

二级引证文献81

相关作者

相关机构

相关主题

浏览历史

基于Gammatone滤波器组的听觉特征提取被引量：28