GFCC与韵律特征参数融合的语音情感识别被引量：3

Speech Emotion Recognition Based on GFCC and Prosodic Features

导出

摘要为了有效提高语音情感识别的准确率,结合Mel频率倒谱系数特征准确性高、GFCC特征抗噪性强的特点,提出了一种将GFCC与Mel频率倒谱系数、韵律特征相融合的语音情感识别算法。针对高兴、悲伤、惊恐、中性、生气5种情感语音,分别对单一Mel频率倒谱系数特征算法、单一GFCC特征算法及改进的混合特征算法进行实验比对分析。实验结果表明,加入GFCC的混合特征后,语音情感识别算法的识别准确率及稳定性均有明显的提高,对公安工作具有现实的意义。 In order to effectively improve the accuracy of speech emotion recognition,combining the characteristics of the Mel-frequency Cepstral Coefficients(MFCC)with high accuracy and theγ-Tone Filter Cepstral Coefficients(GFCC)with strong anti-noise ability,a speech emotion recognition Algorithm based on GFCC,MFCC and prosody features is proposed to improve the accuracy of speech emotion recognition in complex backgrounds.Experimental results show that the recognition accuracy and stability of the speech emotion recognition algorithm are obviously improved after adding GFCC’s mixed features,which is of great practical significance to the police work.

作者王华朋刘恩晁亚东刘元周倪令格 WANG Huapeng;LIU En;CHAO Ya-dong;LIU Yuan-zhou;NI Ling-ge(Department of Audio-Visual Data Inspection Technology,Criminal Investigation Police University of China,Liaoning Shenyang 110035)

机构地区中国刑事警察学院声像资料检验技术系

出处《中国刑警学院学报》 2020年第2期124-128,共5页 Journal of Criminal Investigation Police University of China

基金公安部公安理论及软科学(编号:2017LLYJXJXY040) 重庆市高校刑事科学技术重点实验室(西南政法大学)开放基金(编号:XKZDSYS2019-Z1) 上海市现场物证重点实验室开放课题基金(编号:2018XCWZK09)。

关键词 GFCC SVM 语音情感特征情感识别 γ-Tone Filter Cepstral Coefficients(GFCC) Support Vector Machine(SVM) Speech emotion feature Emotion recognition

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
2王华朋.基于听觉模型的法庭语音证据特征量化[J].中国刑警学院学报,2018(1):119-122. 被引量：6
3胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：30
4林海波,王可佳.一种新的听觉特征提取算法研究[J].南京邮电大学学报（自然科学版）,2017,37(2):27-32. 被引量：11
5韩纪庆,邵艳秋.基于语音信号的情感处理研究进展[J].电声技术,2006,30(5):58-62. 被引量：11
6韩一,王国胤,杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报（自然科学版）,2008,20(5):597-602. 被引量：23

二级参考文献119

1蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：38
2李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22
3[1]DAVIS S B,MERMELSTEIN P.Comparison of parametric representations of monosyllabic word recognition in continuously spoken sentences[J].IEEE Transactions on Speech Acoustic Processing,1980,28:357-366.
4[3]PAOT L,CHEN Y T,YEH J H,et al.Emotion Recognition and Evaluation of Mandarin Speech Using Weighted D-KNN Classification[EB/OL].(2005-03-10)[2008-02-10] http://www.actapress.com/Paperlnfo.aspx? PaperID=27854reasor=500.
5[4]YEN T N,BASS I,Li M K,et al.Investigation of Combining SVM and Decision Tree for Emotion Classification.[EB/OL].(2005-10-20)[2008-02-10] http://pertal.acm.org/citation.cfm? id=1106780.1107199cou=dl=ACM.
6[5]CHAKROBORTY S,ROY A,MAJUMDAR S,et al.Capturing Complementary Information via Reversed Filter Bank and Parallel Implementation with MFCC for Improved Text-Independent Speaker Identification[EB/OL].(2007-04-12)[2008-02-10]http://portal.acm.org/citation.cfm? id=1260199.1260281.
7COWIE R,CORNELIUS R R.Describing the emotional states that are expressed in speech[J].Speech Communication,2003,40:5-32.
8KIENAST M,PAESCHKE A,SENDLMEIER W.Articulatory reduction in emotional speech[C].In:Proceedings of the 6th European Conference on Speech Communication and Technology 1999.Budapest,Hungary,1999:117-120.
9MURRAY IR,ARNOTT JL.Toward a simulation of emotion in synthetic speech:a review of the literature on human vocal emotion[J].Journal of the Acoustical Society of American,1993,93(2):1 097-1 108.
10ALTER K,TANK E,KOTZ S.Accentuation and emotions-two different systems[C].In:Proceedings of the ISCA Workshop(ITRW) on Speech and Emotion,Newcastle,Northern Ireland,2000:138-142.

共引文献238

1郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3李炜,刘禹,李立刚,周亮,宋长山.基于自适应降噪的柱塞泵故障音频特征提取方法[J].国外电子测量技术,2023,42(1):1-6. 被引量：5
4张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
5万济萍,刘子菡,王玥,刘婉姬,张清涛,辛杰.基于语音识别技术口语自动评测的专利分析[J].电声技术,2012,36(S1):53-56. 被引量：1
6徐露,徐明星,杨大利.面向情感变化检测的汉语情感语音数据库[J].清华大学学报（自然科学版）,2009(S1):1413-1418. 被引量：6
7冯哲,孙吉贵,张长胜,王岩.汉语语音合成的研究进展[J].吉林大学学报（信息科学版）,2007,25(2):198-206. 被引量：7
8柳春,于洪志.语音合成技术研究[J].卫生职业教育,2008,26(11):64-66. 被引量：3
9赵艳,赵力,邹采荣.耳语音的语音处理研究综述[J].声学技术,2008,27(4):562-569. 被引量：4
10袁正午,肖旺辉.改进的混合MFCC语音识别算法研究[J].计算机工程与应用,2009,45(33):108-110. 被引量：18

同被引文献16

1朱海涛.基于神经网络的语音识别鲁棒性研究[J].中国科技信息,2008(5):276-277. 被引量：1
2吕霄云,王宏霞.基于MFCC和短时能量混合的异常声音识别算法[J].计算机应用,2010,30(3):796-798. 被引量：29
3刘波霞,陈建峰.基于特征分析的环境声音事件识别算法[J].计算机工程,2011,37(22):261-263. 被引量：15
4胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：30
5张涛,苏春玲.一种用于枪声的多级检测识别技术[J].电子设计工程,2013,21(18):56-58. 被引量：3
6苏力,李阳,庞宇辰.基于Labview软件的MFCC特征参数提取程序设计[J].科学技术创新,2018(5):80-81. 被引量：3
7卓嘎,姜军,董志诚.藏语语音时域参数提取关键技术研究[J].电脑知识与技术,2018,14(3Z):186-188. 被引量：2
8于吉,吕剑虹.基于循环神经网络的动态模型辨识[J].工业控制计算机,2018,31(3):151-152. 被引量：3
9郭卉,姜囡,任杰.基于MFCC和GFCC混合特征的语音情感识别研究[J].光电技术应用,2019,34(6):34-39. 被引量：10
10张学祥,雷菊阳.基于DNN与基音周期的说话人识别[J].计算机与现代化,2020,0(1):122-126. 被引量：5

引证文献3

1许文杰,杨淇善.基于特征参数LPCC与AMDF的异常声音检测[J].长江信息通信,2021,34(10):110-113. 被引量：2
2郑晨颖,马建芬,张朝霞.基于多特征融合的参数再合成语音增强算法[J].计算机工程与设计,2023,44(8):2367-2373. 被引量：2
3吴晶晶,罗志豪,李伟,赵慎.基于循环神经网络模型的无人机音频信号识别算法研究[J].电声技术,2024,48(5):58-63.

二级引证文献4

1汪兰兰,蔡昌新.基于改进线性预测基音频率的语音情感识别系统[J].科学技术与工程,2022,22(26):11524-11532. 被引量：4
2蔡书琛,杨晶东,翁雯浩,齐晨浩,尧明慧,燕海霞.基于频域特征图的高血压靶器官损伤脉搏波预测模型[J].数据采集与处理,2023,38(4):898-914.
3李瞳.基于虚拟仿真技术的配音技术研究[J].自动化与仪器仪表,2024(9):285-288.
4杜雨潇.基于维纳滤波增强算法的计算机辅助语言学习系统研究[J].自动化与仪器仪表,2024(9):317-320.

1孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：16
2邓婷燕,张伟泽.基于双向LSTM神经网络和注意模型的语音情感分析[J].信息通信,2020,0(1):65-66. 被引量：3
3张洛红,王凡凡,王玥,常艳娜,柴易达,王文韬,王瑜.延安市农村生活源水污染物产排系数研究[J].中国农村水利水电,2020(6):87-91. 被引量：3
4李鹤,冉妮,王蔚.基于知识图谱的语音情感识别研究分析[J].计算机技术与发展,2020,30(6):135-140. 被引量：2
5洪兆金,魏晨阳,庄媛,王影,王祎庭,赵力.基于深度神经网络的语音情感识别及性格分析[J].信息化研究,2020,46(1):48-53. 被引量：3
6李田港,叶硕,叶光明,褚钰.基于集成学习的语音情感识别算法研究[J].计算机技术与发展,2020,30(6):82-86. 被引量：5
7余琳,姜囡.基于Gammatone滤波器的混合特征语音情感识别[J].光电技术应用,2020,35(3):50-54. 被引量：7

中国刑警学院学报

2020年第2期

浏览历史

内容加载中请稍等...

GFCC与韵律特征参数融合的语音情感识别被引量：3

参考文献6

二级参考文献119

共引文献238

同被引文献16

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

GFCC与韵律特征参数融合的语音情感识别 被引量：3

参考文献6

二级参考文献119

共引文献238

同被引文献16

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

GFCC与韵律特征参数融合的语音情感识别被引量：3