融合非线性幂函数和谱减法的CFCC特征提取被引量：11

CFCC feature extraction for fusion of the power-law nonlinearity function and spectral subtraction

下载PDF

导出

摘要为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。 This paper presents an improved speech feature extraction algorithm for improving the accuracy of speech recognition in noisy environment.A New Cochlear Filter Cepstral Coefficient(NCFCC)is extracted by the power-law nonlinear function which can simulate the auditory characteristics of the human ear.Then,the spectral subtraction is introduced in the feature extraction front end to enhance the signal,and the new feature and the first order difference are composed of a mixed feature parameter,after which the combined principal component analysis is made to reduce the dimension of the hybrid feature.The final feature is used in a non-specific persons,isolated words,and small-vocabulary speech recognition system.Experimental results show that,compared with the traditional Cochlear Filter Cepstral Coefficients(CFCC)feature,the Cochlear Filter Cepstral Coefficients extracted from the power-law nonlinear function significantly improve the accuracy of speech recognition.The mixed feature parameter can achieve a better speech recognition performance than a single feature.Combined with the feature set of the principal component analysis(PCA),the recognition accuracy can reach up to 88.10%when the signal to noise ratio(SNR)is 0 dB.

作者白静史燕燕薛珮芸郭倩岩 BAI Jing;SHI Yanyan;XUE Peiyun;GUO Qianyan(College of Information and Computer,Taiyuan University of Technology,Taiyuan 030024,China)

机构地区太原理工大学信息与计算机学院

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第1期86-92,共7页 Journal of Xidian University

基金山西省科技攻关(社会发展)项目(20120313013-6) 山西省青年科技研究基金(2013021016-1)

关键词语音识别非线性幂函数耳蜗滤波倒谱系数谱减法 peech recognition power-law nonlinearity function cochlear filter cepstral coefficients spectral subtraction

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1佀文娟,程艳玲,杨丹丹,王欣.小鼠外侧丘系背核神经元对纯音的反应特性[J].生理学报,2016,68(1):1-11. 被引量：2
2岳倩倩,周萍,景新幸.基于非线性幂函数的听觉特征提取算法研究[J].微电子学与计算机,2015,32(6):163-166. 被引量：5
3吴迪,陶智,张晓俊,周燕,潘欣裕,肖仲喆,赵鹤鸣.感知听觉场景分析的说话人识别[J].声学学报,2016,41(2):260-272. 被引量：4
4李大卫,杨日杰,韩建辉.舰船噪声环境下改进语音信号增强算法[J].西安电子科技大学学报,2016,43(5):133-138. 被引量：3
5杨威,刘宏清,黎勇,周翊.冲击噪声下的LMS和RLS联合滤波算法[J].西安电子科技大学学报,2017,44(2):165-170. 被引量：14
6吴迪,曹洁,王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J].光学精密工程,2013,21(6):1598-1604. 被引量：18
7兰巍,贾素玲,宋世民,李可.基于随机森林的航天器电信号多分类识别方法[J].北京航空航天大学学报,2017,43(9):1773-1778. 被引量：7

二级参考文献61

1王丹,皮建辉,唐佳,吴飞健,陈其才.弱噪声对下丘神经元声强敏感性的动态调制(英文)[J].生理学报,2005,57(1):59-65. 被引量：10
2陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
3魏传锋,贾阳,王浚.航天器在轨自主热故障诊断专家系统研究[J].装备环境工程,2006,3(3):54-57. 被引量：4
4李可,庞丽萍,刘旺开,王浚.环境模拟舱体的建模仿真及控制方法[J].北京航空航天大学学报,2007,33(5):535-538. 被引量：15
5KINNUNEN T, LI H Z.An overview of text-independent speaker recognition: from features to supervectors [J].Speech Communication, 2010,52:12-40.
6HAMID R,SEYYED A ,HOSSEIN B,et al..A new representation for speech frame recognition based on redundant wavelet filter banks [J].Speech Communication, 2012, 54:256-271.
7TYLER K P, STEPHANIE N,JOHN D,et al..Human voice recognition depends on language ability [J].Science, 2011,333:595.
8PARVIN Z,SEYYED A.Robust speech recognition by extracting invariant features [J].Procedia - Social and Behavioral Sciences, 2012,32(3):230-237.
9SHAO Y,JIN ZH ZH,WANG D L.An auditory based feature for robust speech recognition [C].ICASSP,2009:4625-4628.
10MAK B K W, LAI T C, TSANG I W, et al..Maximum penalized likelihood kernel regression for fast adaptation [J].IEEE Transactions on Audio, Speech and Language Processing, 2009, 17(7): 1372-1381.

共引文献45

1周海涛,王志刚,刘昌明.基于主成分分析和高斯混合模型的耐火材料损伤信号分类[J].武汉科技大学学报,2014,37(4):269-272. 被引量：3
2魏葆春,甘发旺.物联网多层设备信息通信数据分类识别仿真[J].计算机仿真,2019,36(1):425-428. 被引量：3
3徐正平,许永森.S3C2440A在步进电机控制器人机交互中的应用[J].液晶与显示,2015,30(1):70-76. 被引量：5
4方林.联合小波变换和EMD非线性特征提取在暂态电能识别的应用[J].科技风,2015(20):88-90.
5王茂蓉,周萍,景新幸.MFCC和短时TEO能量的混合参数应用于说话人识别[J].微电子学与计算机,2016,33(1):144-148. 被引量：5
6唐宗渤,王茂蓉,周萍.基于相关距离Fisher比的混合参数用于说话人识别[J].大众科技,2016,18(1):13-16.
7李哲军,周萍,景新幸.基于改进噪声估计的谱减法应用于说话人识别[J].计算机测量与控制,2016,24(4):155-158.
8谢小娟,曾以成,熊冰峰.说话人识别中基于Fisher比的特征组合方法[J].计算机应用,2016,36(5):1421-1425. 被引量：2
9申铉京,翟玉杰,卢禹彤,王玉,陈海鹏.基于信道补偿的说话人识别算法[J].吉林大学学报（工学版）,2016,46(3):870-875. 被引量：3
10唐宗渤,周萍,王茂蓉,刘继锦.反蓄意模仿说话人识别系统中特征参数提取的研究[J].微型机与应用,2016,35(12):18-20. 被引量：1

同被引文献63

1陈紫强,曾庆宁,刘庆华.基于先验信噪比参数自适应的频域联合语音增强方法[J].电子与信息学报,2007,29(2):439-442. 被引量：5
2张卫强,刘加.基于听感知特征的语种识别[J].清华大学学报（自然科学版）,2009(1):78-81. 被引量：21
3尹向雷,郑恩让,马令坤,马晓虹.基于掩蔽效应的维纳滤波器语音增强及DSP实现[J].电子技术应用,2010,36(4):123-126. 被引量：1
4史军,张乃通,刘晓萍.一种新型分数阶小波变换及其应用[J].中国科学：信息科学,2012,42(2):127-137. 被引量：8
5李晶皎,安冬,杨丹,王骄.噪声环境下说话人识别的TEO-CFCC特征参数提取方法[J].计算机科学,2012,39(12):195-197. 被引量：4
6田莎莎,田艳.基于改进谱减法的语音识别系统去噪[J].大众科技,2012,14(12):47-48. 被引量：1
7吴迪,曹洁,王进花.基于自适应高斯混合模型与静动态听觉特征融合的说话人识别[J].光学精密工程,2013,21(6):1598-1604. 被引量：18
8陈欢,邱晓晖.改进谱减法语音增强算法的研究[J].计算机技术与发展,2014,24(4):69-71. 被引量：14
9黄羿博,张秋余,袁占亭,杨仲平.融合MFCC和LPCC的语音感知哈希算法[J].华中科技大学学报（自然科学版）,2015,43(2):124-128. 被引量：16
10李作强,高勇.基于CFCC和相位信息的鲁棒性说话人辨识[J].计算机工程与应用,2015,51(17):228-232. 被引量：6

引证文献11

1王晓华,要鹏超,马丽萍,王文杰,张蕾.车间环境下机器人语音控制的特征提取算法[J].西安电子科技大学学报,2020,47(2):16-22. 被引量：2
2曾金芳,徐文涛,黄费贞.基于耳蜗倒谱系数的说话人识别[J].电子技术与软件工程,2020(5):85-86. 被引量：1
3张莉,李文钧,岳克强.基于自适应参数的多窗谱谱减法算法改进[J].软件导刊,2020,19(5):74-77. 被引量：3
4杨纯,李垠韬,宋伟,杨广涛,孟继军,门宝霞,叶宝安.Φ-OTDR光纤传感电缆防外破监测数据预处理方法[J].激光与红外,2021,51(4):486-492. 被引量：10
5梅淑琳,贾海蓉,王晓刚,武奕峰.动态特征联合新掩模优化神经网络语音增强[J].西安电子科技大学学报,2021,48(3):91-98.
6付英,刘增力.基于VMD和Teager能量算子倒谱的方言语种识别[J].通信技术,2022,55(4):435-442. 被引量：1
7张敏,贾海蓉,张刚敏,王素英.结合自适应软掩模和混合特征的语音增强[J].西安电子科技大学学报,2022,49(2):108-115.
8龙华,黄张衡,邵玉斌,杜庆治,苏树盟.基于改进CFCC特征提取的语种识别算法研究[J].通信学报,2022,43(12):211-221.
9黄张衡,龙华,邵玉斌,杜庆治,苏树盟,王延凯.噪声环境下听觉特征融合的语种识别[J].现代电子技术,2023,46(5):47-54. 被引量：1
10华英杰,朵琳,刘晶,邵玉斌.基于听觉特性和发声特性的语种识别[J].云南大学学报（自然科学版）,2023,45(4):807-814.

二级引证文献18

1徐金石,杨立东.基于多窗谱减和LMS在工厂中的去噪实现[J].电子测量技术,2021,44(24):66-71. 被引量：1
2李军,李岩.基于BOTDR技术的OPGW线廊环境灾变监测应用[J].科技导报,2022,40(15):104-112.
3上官霞.基于神经网络的机器人运行自动化控制方法研究[J].工业仪表与自动化装置,2022(5):71-75. 被引量：1
4孙逸飞,涂振宇,相敏月,马飞,方强.基于多窗谱估计与NLMS自适应滤波算法的单通道语音增强[J].通信技术,2022,55(11):1419-1427. 被引量：2
5龙华,黄张衡,邵玉斌,杜庆治,苏树盟.基于改进CFCC特征提取的语种识别算法研究[J].通信学报,2022,43(12):211-221.
6曹海文,詹加舟,刘晓,梁爽,窦子栋.北斗定位在输电线防外破监管系统中的设计与实现[J].中国高新科技,2022(20):84-85. 被引量：1
7尚秋峰,李雪丽.基于LSTM的布里渊增益谱提取方法[J].光子学报,2023,52(1):106-115.
8王瑞,安哲立,田四明,许新骥,陈磊.基于谱减法的隧道地震波超前探测去噪方法[J].隧道建设（中英文）,2023,43(3):441-450.
9徐芝灿,刘本永.基于特征融合与改进GMM-UBM的方言分析[J].通信技术,2023,56(4):419-424.
10聂文芳,涂海亮,刘军.大数据环境下光纤通信网络异常流量动态检测方法[J].激光杂志,2023,44(9):172-176. 被引量：3

1贾青,余钟波,杨传国,詹艳玲.淮北平原土壤湿度变化特征及其与潜水埋深响应关系[J].水电能源科学,2017,35(11):123-126. 被引量：2
2张国智.气管的非线性弯曲力学性能研究[J].力学与实践,2018,40(5):538-542. 被引量：2
3王建荣,高永春,张句,魏建国,党建武.基于Kinect辅助的机器人带噪语音识别[J].清华大学学报（自然科学版）,2017,57(9):921-925. 被引量：5
4曹晶晶,许洁萍,邵聖淇.多噪声环境下的层级语音识别模型[J].计算机应用,2018,38(6):1790-1794. 被引量：8
5房敏.基于HMM的语音识别技术[J].计算机产品与流通,2018,7(3):91-91.
6和丽华,江涛,潘文林,杨建香,解雪琴,王璐,余彩裙.佤语语音语料端点检测算法[J].云南民族大学学报（自然科学版）,2019,28(2):186-190. 被引量：2
7赵涛,张羿,王永和,张海娇.基于深度学习的人机语音交互平台[J].信息系统工程,2019,32(1):102-104. 被引量：7
8田亚立,梁波.基于单片机的智能语音小车控制系统设计[J].电子技术与软件工程,2019(2):247-248. 被引量：6
9田文,戴跃伟,王彪.基于人耳听觉模型的船舶辐射噪声相似度分析[J].江苏科技大学学报（自然科学版）,2018,32(5):690-694. 被引量：1
10常宁市委改革办.“小茶果”激活富民“大产业”[J].衡阳通讯,2018(9):19-20.

西安电子科技大学学报

2019年第1期

浏览历史

内容加载中请稍等...

融合非线性幂函数和谱减法的CFCC特征提取被引量：11

参考文献7

二级参考文献61

共引文献45

同被引文献63

引证文献11

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

融合非线性幂函数和谱减法的CFCC特征提取 被引量：11

参考文献7

二级参考文献61

共引文献45

同被引文献63

引证文献11

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

融合非线性幂函数和谱减法的CFCC特征提取被引量：11