融合声门波信号频谱特征的语音情感识别

Speech Emotion Recognition Combined with the Spectrum Feature of Glottal Waveform

下载PDF

导出

摘要为了提高语音情感识别的准确率,本文针对新的声门波信号频谱特征抛物线频谱参数(parabolic spectralparameter,PSP)和谐波丰富因子(harmonic richness factor,HRF)进行了研究,并将其应用到语音的情感识别中.提取6种不同情感(生气、害怕、高兴、中性、悲伤和惊奇)语音信号的发音速率和短时能量、基音频率、前3个共振峰、12阶Mel频率倒谱系数(MFCC)的最大值、最小值、变化范围和平均值等常用特征构成一个特征矢量,并利用主成分分析方法降维;提取声门波信号的频谱特征PSP和HRF,并分析了PSP和HRF的情感表达能力;采用深度学习栈式自编码算法对只有常用特征以及融合了声门波信号频谱特征后的特征进行分类.结果表明:融合声门波信号频谱特征后识别率更高. In order to improve the accuracy of emotional speech recognition,the parabolic spectral parameter（PSP）and harmonic richness factor（HRF）which are frequent domain features of the glottal waveform are analyzed,and they are applicated in speech emotion recognition.First of all,acquisition the pronunciation rate and the maximum,minimum,range and average of pitch frequency,first three formant parameters,12 order Mel frequency cepstrum coefficients（MFCC）of six different emotions speech signals（angry,fear,happy,neutral,sad,surprise）to construct a feature vector,And use principal component analysis（PCA）method to reduce the vector dimension;Then,extract PSP and HRF of the glottal waveform,and analyze the emotional expression ability of PSP and HRF;Finally,using the stacked autoencoderclassifier aims to classify the features which are traditional and have the characteristics of the glottal signal.The results show that it can achieve a higher recognition rate to combine with thethe spectrum feature of glottal waveform.

作者李昊璇师宏慧乔晓艳 LI Haoxuan SHI Honghui QIAO Xiaoyan(College of Physics and Electronics Engineering, Shanxi University, Taiyuan 030006, Chin)

机构地区山西大学物理电子工程学院

出处《测试技术学报》 2017年第1期8-16,共9页 Journal of Test and Measurement Technology

基金山西省回国留学人员科研资助项目(2014-010) 山西省自然科学基金资助项目(2013011016-2)

关键词声门波信号抛物线频谱参数谐波丰富因子栈式自编码语音情感识别 glottal waveform parabolic spectral parameter harmonic richness factor stacked autoen-coder speech emotional recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1何凌,黄华,刘肖珩.基于声门特征参数的语音情感识别算法研究[J].计算机工程与设计,2013,34(6):2147-2151. 被引量：4
2白洁,蒋冬梅.归一化振幅商在语音情感识别中的应用[J].计算机仿真,2009,26(2):183-186. 被引量：1
3张石清,李乐民,赵知劲.人机交互中的语音情感识别研究进展[J].电路与系统学报,2013,18(2):440-451. 被引量：29

二级参考文献97

1谢波,陈岭,陈根才,陈纯.普通话语音情感识别的特征选择技术[J].浙江大学学报（工学版）,2007,41(11):1816-1822. 被引量：13
2韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
3蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：37
4林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007,12(1):90-98. 被引量：33
5Tato Requel, Santos Bocio, Kompe Ralf, J M Pardo. Emotion space improves emotion recognition [ C ]. Proe. ICSLP. Denver, Colorado. 2002,3 : 2029 -2032.
6Laver John. The Phonetic Description of Voice Quality[ M]. Cambridge University Press, 1980.
7Klans R Seherer. Vocal affect expression: A review and a model for future research[ J]. Psychological Bulletin, 1986,99 ( 2 ) : 143 - 165.
8Gobl Christer, Chasaide Ailbhe Ni. The role of voice quality in communicating emotion, mood and attitude[ J]. Speech Communication,2003,40: 189 - 212.
9Alku Paavo, Backstrom Tom, Vilkman Erhhi. Normalized amplitude quotient for parameterization of the glottal flow[ J]. Journal of the Acoustical Society of America, 2002, 112(2) : 701 -710.
10Lehto Laura, et al. Comparison of two inverse filtering methods in parameterization of the glottal closing phase characteristics in different phonation types[J]. Journal Voice, 2007, 21 (2) : 138 - 150.

共引文献30

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2周红标.融合语音和脉搏的多模态情感识别研究[J].微电子学与计算机,2015,32(6):5-9. 被引量：4
3徐照松,元建.基于BP神经网络的语音情感识别研究[J].软件导刊,2014,13(4):11-13. 被引量：5
4魏平杰,樊兴华.语音倾向性分析中的特征抽取研究[J].计算机应用研究,2014,31(12):3580-3583. 被引量：1
5叶吉祥,刘亚.ITD在语音情感识别中的研究[J].计算机工程与应用,2014,50(22):203-206.
6姜晓庆,夏克文,夏莘媛,祖宝开.采用半定规划多核SVM的语音情感识别[J].北京邮电大学学报,2015,38(B06):67-71. 被引量：7
7徐照松,元昌安,覃晓,元建,李双.基于关联规则的语音情感中韵律特征抽取算法研究[J].计算机应用与软件,2015,32(9):42-45. 被引量：1
8余春艳,翁子林.音频情感感知与视频精彩片段提取[J].计算机辅助设计与图形学学报,2015,27(10):1890-1899. 被引量：4
9赵涓涓,马瑞良,张小龙.基于决策树和改进SVM混合模型的语音情感识别[J].北京理工大学学报,2017,37(4):386-390. 被引量：14
10刘颖,贺聪,张清芳.基于核相关分析算法的情感识别模型[J].吉林大学学报（理学版）,2017,55(6):1539-1544. 被引量：3

1赵兴录,何新亮,盛松林,刘列.雷达发射机辐射发射测试研究[J].雷达与对抗,2010,30(3):51-55. 被引量：2
2张礼和,徐益.嘶音声门波与声带模型特征研究[J].旭光技术,1991(2):1-5.
3王成友,郑林华,黄小严.用逆滤波基音同步分析提取声门波的方法[J].国防科技大学学报,1994,16(3):25-28.
4张余,李连宝,柳永祥,陈勇.一种基于视意图式的用频系统电磁频谱参数泄露检测与识别方法[J].通信对抗,2015,34(1):11-14. 被引量：2
5李霞.如何提升播音员主持人的情感表达能力[J].西部广播电视,2017,38(2):127-127. 被引量：1
6胡琼,赵春宇.利用逆滤波和相平面获取高自然声门波的研究[J].电声技术,2011,35(5):59-63. 被引量：2
7师宏慧,李昊璇,乔晓艳.基于残差信号谐波和的声门波提取[J].测试技术学报,2016,30(1):80-85.
8严天峰,赵杰,冯超,孟令为.基于多帧统计谱的高速铁路GSM-R干扰信号分离算法[J].计算机应用,2012,32(11):3092-3095. 被引量：2
9杨明海.妙用Adobe Audition频谱分析仪[J].无线电,2004(6):32-34.
10郑义,蒋刚毅,张礼和,蔡金海.基于声带振动模型和声门波的嘶音研究[J].声学学报,1996,21(6):884-892. 被引量：1

测试技术学报

2017年第1期

浏览历史

内容加载中请稍等...

融合声门波信号频谱特征的语音情感识别

参考文献3

二级参考文献97

共引文献30

相关作者

相关机构

相关主题

浏览历史