基于非线性幂函数的听觉特征提取算法研究被引量：5

The Auditory Feature Extraction Algorithm Based on Power-law Nonlinearity Function

下载PDF

导出

摘要为提高说话人识别系统的识别率,提出采用非线性幂函数对人耳的听觉特性进行模拟,分别得到新的梅尔频率倒谱系数MFCC及其差分、加权倒谱系数.对得到的新的特征值进行增减分量分析,以获得高贡献值的倒谱分量,组成新的混合参数,使用高斯混合模型(GMM)分别对纯语音和三种典型噪声背景下的语音进行说话人识别,与传统MFCC相比,采用非线性幂函数改进的MFCC在识别率及鲁棒性上均有明显提高. In order to improve the speaker recognition accuracy,the auditory characteristics of human are simulated by the power-law nonlinear function,and the new Mel frequency cepsral coefficients(MFCC)and its difference,weighted cepstral coefficients are obtained.The new characteristic values are analized from two angels that are increasing components and decreasing components,the vector with high contribution is drawn from it and new hybrid parameters are composed of them.GMM is used to recognize the speakers in four kinds of conditions which are pure speech and three kinds of typical noise background.Compared with the traditional of MFCC,New MFCC has improved the recognition rote and robustress.

作者岳倩倩周萍景新幸

机构地区桂林电子科技大学电子工程与自动化学院桂林电子科技大学信息与通信学院

出处《微电子学与计算机》 CSCD 北大核心 2015年第6期163-166,共4页 Microelectronics & Computer

关键词说话人识别非线性幂函数听觉特征提取倒谱贡献分析 GMM speaker recognition nonlinear power-law auditory feature extraction cepstrum contribution analysis GMM

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1黄山奇,张连海,屈丹.一种基于人耳听觉感知和子带补偿滤波的鲁棒语言辨识特征参数提取算法[J].模式识别与人工智能,2012,25(1):166-171. 被引量：2
2李建文,张晋平.基于改进语音特征提取方法的语音识别[J].微电子学与计算机,2009,26(7):230-233. 被引量：8
3贺前华,王志锋,Alexander I Rudnicky,朱铮宇,李新超.基于改进PNCC特征和两步区分性训练的录音设备识别方法[J].电子学报,2014,42(1):191-198. 被引量：9
4甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报（自然科学版）,2001,37(3):371-378. 被引量：74

二级参考文献26

1王永琦,邓琛,杨洋.语音增强用于抗噪声的汉语说话人识别[J].微电子学与计算机,2006,23(2):166-168. 被引量：4
2杨毅,杨宇,余达太.语音增强及其消噪能力研究[J].微电子学与计算机,2006,23(7):202-203. 被引量：5
3杨行峻迟惠生.数字语音信号处理[M].北京:电子工业出版社,1995..
4Nordholm S, Siow Yong Low. Speech signal extraction utilizing PCA- ICA algorithm with a non - uniform spacing microphone array[ C]//Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing. France: Toulouse, 2006 : 965.
5Tsuneo N. Feature extraction for speech recognition based on ohogonal acoustic-feature panes and LDA[ C]//Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing. USA: Phoenix, AZ, 1999:421-424.
6Matejka P.Phonotactic and Acoustic Language Recognition.Ph.D Dissertation.Brno,Czech:Brno University of Technology,2008.
7Kim C,Stern R M.Feature Extraction for Robust Speech Recognition Using a Power-Law Nonlinearity and Power-Bias Subtraction//Proc of the10th Annual Conference of the International Speech Communication Association.Brighton,UK,2009:28-31.
8Chiu Y H,Stern R M.Analysis of Physiologically-Motivated Signal Processing for Robust Speech Recognition//Proc of the9th International Conference on Spoken Language.Brisbane,Australia,2006:1000-1003.
9Chiu Y H B,Stern R M.Minimum Variance Modulation Filter for Robust Speech Recognition//Proc of the IEEE International Conference on Acoustics,Speech and Signal Processing.Taipei,China,2009:3917-3920.
10Aertsen A M H J,Olders J H J,Johannesma P I M.Spectral-Temporal Receptive Fields of Auditory Neurons in the Grassfrog.Biological Cybernetics,1981,39(3):195-209.

共引文献89

1王光艳,赵晓群,王霞.基于MATLAB GUI的语音信号特征提取系统设计[J].河北工业大学学报,2010,39(4):14-18. 被引量：11
2闫向宏,张亚萍,乔文孝.基于倒双谱的套管井声学评价系统特性辨识[J].应用声学,2005,24(4):250-254.
3李鹏怀,徐佩霞.基于DSP的嵌入式语音识别系统的实现[J].计算机工程,2005,31(16):160-162. 被引量：10
4崔双喜,朴春俊.噪声环境下的语音识别性能研究[J].计算机测量与控制,2005,13(11):1276-1278. 被引量：11
5马军,杨苹.一种聚焦式模糊分段算法及其在语音识别中的应用[J].科技资讯,2006,4(7):2-4.
6白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7
7贺志阳,张玲华.基于GMM统计参数和SVM的说话人辨认研究[J].南京邮电大学学报（自然科学版）,2006,26(3):78-82. 被引量：2
8王书诏,邱天爽.与文本无关的说话人识别系统的设计[J].电声技术,2006,30(12):51-52. 被引量：1
9王书诏,邱天爽.说话人识别研究综述[J].电声技术,2007,31(1):51-55. 被引量：9
10但志平,胡刚,刘勇.基于LPC倒谱参数分析的说话人识别系统[J].三峡大学学报（自然科学版）,2007,29(1):60-62. 被引量：2

同被引文献33

1江波,张江鑫.线性预测编码技术及其在G.729中的应用研究[J].浙江工业大学学报,2009,37(2):196-200. 被引量：5
2余建潮,张瑞林.基于MFCC和LPCC的说话人识别[J].计算机工程与设计,2009,30(5):1189-1191. 被引量：46
3徐世艳.基于延拓技术的经验模态分解改进算法[J].吉林大学学报（信息科学版）,2009,27(4):359-365. 被引量：6
4程军圣,郑近德,杨宇.一种新的非平稳信号分析方法——局部特征尺度分解法[J].振动工程学报,2012,25(2):215-220. 被引量：166
5胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：14
6李晶皎,安冬,杨丹,王骄.噪声环境下说话人识别的TEO-CFCC特征参数提取方法[J].计算机科学,2012,39(12):195-197. 被引量：4
7张晓俊,陶智,吴迪,肖仲喆,赵鹤鸣.采用多特征组合优化的语音特征参数研究[J].通信技术,2012,45(12):98-100. 被引量：4
8李晋徽,杨俊安,项要杰.基于高斯滤波器及费舍尔准则的特征提取方法[J].电路与系统学报,2013,18(2):400-404. 被引量：2
9李杰,周萍,杜志然.短时TEO能量在带噪语音端点检测中的应用[J].计算机工程与应用,2013,49(12):144-147. 被引量：13
10吴迪,曹洁,王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J].光学精密工程,2013,21(6):1598-1604. 被引量：18

引证文献5

1谢小娟,曾以成,熊冰峰.说话人识别中基于Fisher比的特征组合方法[J].计算机应用,2016,36(5):1421-1425. 被引量：2
2余倩.基于特征提取算法的交互式英汉翻译系统设计[J].现代电子技术,2018,41(4):161-163. 被引量：9
3白静,史燕燕,薛珮芸,郭倩岩.融合非线性幂函数和谱减法的CFCC特征提取[J].西安电子科技大学学报,2019,46(1):86-92. 被引量：11
4史燕燕,白静.融合CFCC和Teager能量算子倒谱参数的语音识别[J].计算机科学,2019,46(5):286-289. 被引量：8
5王秀芳,郭淞赫,崔翔宇,杨丹迪.基于改进经验模态分解的语音信号特征提取法[J].吉林大学学报（信息科学版）,2021,39(3):288-294. 被引量：3

二级引证文献33

1朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：3
2甄倩倩,张庭亮.说话人识别综述[J].科技资讯,2017,15(25):241-243. 被引量：1
3林寒.基于多语言交互的英语翻译在线辅助系统设计[J].现代电子技术,2019,42(6):22-25. 被引量：14
4孙瑞.果蝇算法优化粗糙集特征选择的英语翻译方法设计[J].现代科学仪器,2019,0(4):158-160. 被引量：1
5米婧.特征提取算法下的英汉翻译系统研究[J].单片机与嵌入式系统应用,2020,20(3):54-56. 被引量：5
6饶岩岩.基于语义特征的复杂长句切分式翻译算法研究[J].周口师范学院学报,2020,37(1):95-99. 被引量：2
7王晓华,要鹏超,马丽萍,王文杰,张蕾.车间环境下机器人语音控制的特征提取算法[J].西安电子科技大学学报,2020,47(2):16-22. 被引量：1
8曾金芳,徐文涛,黄费贞.基于耳蜗倒谱系数的说话人识别[J].电子技术与软件工程,2020(5):85-86. 被引量：1
9刘影,韩康康,钱志鸿.基于声音空间梯度的高稳健性击键识别方法[J].通信学报,2020,41(5):96-103. 被引量：4
10张莉,李文钧,岳克强.基于自适应参数的多窗谱谱减法算法改进[J].软件导刊,2020,19(5):74-77. 被引量：3

1马智敏.彩信业务对通信企业的发展贡献分析[J].电信工程技术与标准化,2008,21(10):57-59. 被引量：1
2王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
3刘顺兰,张鹏.次分量分析恒模盲多用户检测算法[J].杭州电子科技大学学报（自然科学版）,2011,31(4):69-72.
4冯军,吴奇,章力,杨秀平.基于贡献值的移动互联网云端质量问题定位方法研究及应用[J].电信技术,2016(3):38-44.
5李欣刚.张颂在播音主持发展中的独到见解与借鉴价值研究[J].西部广播电视,2013,34(08X):101-101.
6李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25
7龚永杰,黎煊,高云,雷明刚,刘望宏,杨专.基于矢量量化的猪咳嗽声识别[J].华中农业大学学报,2017,36(3):119-124. 被引量：10
8李哲军,周萍,景新幸.基于改进噪声估计的谱减法应用于说话人识别[J].计算机测量与控制,2016,24(4):155-158.
9舒若,李世宝,潘辛.SVAC音频编码的特征参数量化器改进[J].信息技术,2014,38(6):50-54.
10郭超,张雪英,刘晓峰.支持向量机在低信噪比语音识别中的应用[J].计算机工程与应用,2013,49(5):213-215. 被引量：1

微电子学与计算机

2015年第6期

浏览历史

内容加载中请稍等...

基于非线性幂函数的听觉特征提取算法研究被引量：5

参考文献4

二级参考文献26

共引文献89

同被引文献33

引证文献5

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于非线性幂函数的听觉特征提取算法研究 被引量：5

参考文献4

二级参考文献26

共引文献89

同被引文献33

引证文献5

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于非线性幂函数的听觉特征提取算法研究被引量：5