语音情感的维度特征提取与识别被引量：8

Dimensional Feature Extraction and Recognition of Speech Emotion

下载PDF

导出

摘要研究了情绪的维度空间模型与语音声学特征之间的关系以及语音情感的自动识别方法。介绍了基本情绪的维度空间模型,提取了唤醒度和效价度对应的情感特征,采用全局统计特征减小文本差异对情感特征的影响。研究了生气、高兴、悲伤和平静等情感状态的识别,使用高斯混合模型进行4种基本情感的建模,通过实验设定了高斯混合模型的最佳混合度,从而较好地拟合了4种情感在特征空间中的概率分布。实验结果显示,选取的语音特征适合于基本情感类别的识别,高斯混合模型对情感的建模起到了较好的效果,并且验证了二维情绪空间中,效价维度上的情感特征对语音情感识别的重要作用。 The relation between the emotion dimension space and speech features is studied. The automatic speech emotion recognition problem is addressed. A dimensional space model of basic emotions is introduced. Speech emotion features are extracted according to the arousal dimension and the valence dimension. And statistic features are used to reduce the influence of the text variations on emotional features. Anger, happiness, sadness and neutral state are studied. Gaussian mixture model is adopted for modeling and recognizing the four categories of emotions. Gaussian mixture number is optimized through experiment for the probability distribution of the 4 categories in the feature space. The experimental results show that the chosen features are suitable for recognizing basic emotions. The Gaussian mixture model achieves satisfactory classification results. The valence features in the two-dimensional space plays a more important role in emotion recognition.

作者李嘉黄程韦余华

机构地区江苏省广播电视总台(集团) 东南大学信息科学与工程学院南京信息职业技术学院电子信息学院

出处《数据采集与处理》 CSCD 北大核心 2012年第3期389-393,共5页 Journal of Data Acquisition and Processing

关键词语音情感识别情绪维度空间高斯混合模型 speech emotion recognition emotion dimension space Gaussian mixture model

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1Barbara A, Spellman D, Willingham T. Current di-rections in cognitive science [M]. Beijing: Beijing Normal University Press, 2007: 1-5.
2Picard R W. Affective Computing [M]. Cambridge: MIT Press, 1997.
3Tolkmitt F J, Scherer K R. Effect of experimentally induced stress on vocal parameters [J]. J Exp Psy- chol: Human Percept Perform, 1986, 12 (3): 302- 313.
4Van Bezooijen R. The characteristics and recogniz- ability of vocal expression of emotions[M]. Foris, Drodrecht, The Netherlands:[s. n. ], 1984.
5黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116. 被引量：33
6黄程韦,金赟,王青云,赵艳,赵力.基于特征空间分解与融合的语音情感识别[J].信号处理,2010,26(6):835-842. 被引量：10
7Yang B, Lugger M. Emotion recognition from speech signals using new harmony features[J]. Sig- nal Processing, 2010, 90(5) : 1415-1423.
8Clavel C, Vasilescu I, Devillers L, et al. Fear-type emotion recognition for future audio-based surveil- lance systems [J]. Speech Communication, 2008, 50 (6) : 487-503.
9Kockmann M, Burger L, Cernoeky J H. Application of speaker and language identification state-of-the- art techniques for emotion recognition[J]. Speech Communication, 2011, 53(9/10): 1172-1185.
10Zeng Z, Pantic M, Roisman G I, et al. A survey of affect recognition methods: audio, visual and spon-taneous expressionsEJ]. IEEE Transactions on Pat- tern Analysis and Machine Intelligence, 2009, 31 (1): 39-58.

二级参考文献16

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3R. Cowie, E. Douglas-Cowie, N. Tsapatsoulis, et al. Emotion recognition in human-computer interaction [ J ]. IEEE Signal Processing magazine, 2001, 18( 1 ) :32-80.
4Klaus R. Scherer, Vocal communication of emotion: A review of research paradigms [ J ]. Speech Communication, 2003, 40 : 227-256.
5Zhongzhe Xiao, Dellandrea E, Weibei Dou, et al. Features extraction and selection for emotional speech classification [ C ]. IEEE Conference on Advanced Video and Signal Based Surveillance, 2005:411-416.
6D. Ververidis, C. Kotropoulos,I. Pitas. Automatic emotional speech classification[ C]. Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, 2004, 1:593-596.
7B. Sehuller, G. Rigoll and M. Lang. Hidden markov model-based speech emotion recognition [ C ]. Proceedings of IEEE-ICASSP, 2003:401-405.
8T. Johnstone. Emotional speech elicited using computer games [ C ]. Fourth International Conference on Spoken Language, 1996, 3 : 1985-1988.
9T. Johnstone, CM van Reekum, K hird, K Kirsner, et al. Affective speech elicited with a computer game [ J ]. Emotion, 2005, 5(4) :513-518.
10N. Amir. Classifying emotions in speech: a comparison of methods [ C ]. Eurospeech 2001, Poster Proceedings, 2001 : 127-130.

共引文献41

1曾光菊.基于粗神经网络的语音情感识别[J].四川理工学院学报（自然科学版）,2011,24(4):472-476. 被引量：3
2余华,黄程韦,张潇丹,金赟,赵力.混合蛙跳算法神经网络及其在语音情感识别中的应用[J].南京理工大学学报,2011,35(5):659-663. 被引量：11
3郑微,李正周,田蕾.基于DSP的智能语音控制系统设计[J].传感器与微系统,2012,31(2):134-136. 被引量：8
4赵亚民.二色补血草栽培技术[J].河北林果研究,2000,15(1):69-80. 被引量：4
5周慧,魏霖静.基于LS-SVM的情感语音识别[J].电子设计工程,2012,20(16):188-190.
6黄程韦,金赟,包永强,余华,赵力.嵌入马尔可夫网络的多尺度判决融合耳语音情感识别[J].信号处理,2013,29(1):98-106. 被引量：4
7张石清,李乐民,赵知劲.人机交互中的语音情感识别研究进展[J].电路与系统学报,2013,18(2):440-451. 被引量：27
8李翔,李昕,胡晨,卢夏衍.面向智能机器人的Teager语音情感交互系统设计与实现[J].仪器仪表学报,2013,34(8):1826-1833. 被引量：10
9王薇,杨丽萍,魏丽,刘艳.语音情感特征的提取与分析[J].实验室研究与探索,2013,32(7):91-94. 被引量：11
10罗武骏,黄程韦,查诚,赵力.越南语语音情感特征分析与识别[J].信号处理,2013,29(10):1423-1432. 被引量：4

同被引文献79

1赵沁平.虚拟现实综述[J].中国科学（F辑:信息科学）,2009,39(1):2-46. 被引量：642
2林舒杨,李翠华,江弋,林琛,邹权.不平衡数据的降采样方法研究[J].计算机研究与发展,2011,48(S3):47-53. 被引量：31
3徐露,徐明星,杨大利.面向情感变化检测的汉语情感语音数据库[J].清华大学学报（自然科学版）,2009(S1):1413-1418. 被引量：6
4朱蕴丽,苗元江.公共卫生事件的心理应激与干预策略[J].南昌大学学报（人文社会科学版）,2005,36(3):49-52. 被引量：55
5Audio—Technica AT2020录音室心形指向电容话筒[J].世界专业音响与灯光,2005,3(4):76-76. 被引量：1
6苏莉,韦波.突发公共卫生事件下的群体心理反应与干预[J].中国行为医学科学,2005,14(12):1139-1141. 被引量：58
7王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
8姚秋明,柴佩琪,宣国荣,杨志强,施云庆.基于期望最大化算法的音频取证中的篡改检测[J].计算机应用,2006,26(11):2598-2601. 被引量：12
9Campbell J P,Shen W,Campbell W M, et al. Foren- sic speaker recognition[J]. IEEE Signal Processing Magazine, 2009,26(2) :95-103.
10Maher R C. Audio forensic examination(authenticity, enhancement, and interpretation)[J]. IEEE Signal Processing Magazine,2009,26(2) :84-94.

引证文献8

1钟巍,孔祥维,尤新刚,王波.基于分数倒谱变换的取证语音拼接特征提取与分析[J].数据采集与处理,2014,29(2):248-253. 被引量：6
2奚吉,赵力,左加阔.基于改进多核学习的语音情感识别算法[J].数据采集与处理,2014,29(5):730-734. 被引量：7
3李嘉,黄程韦,韩辰.声学场景深度识别系统设计[J].数字通信世界,2016(7):12-14.
4菅小艳,韩素青,崔彩霞.不平衡数据集上的Relief特征选择算法[J].数据采集与处理,2016,31(4):838-844. 被引量：15
5李欣怡,张志超.语音驱动的人脸动画研究现状综述[J].计算机工程与应用,2017,53(22):21-28. 被引量：4
6陈颖,肖仲喆.离散标签与维度空间结合的语音数据库设计[J].声学技术,2018,37(4):380-387. 被引量：6
7胡鸿,金玉鑫,段慧云,周洲锋.基于用户旅程的情感计算心理救援机器人设计[J].设计,2021,34(19):150-153. 被引量：1
8闫芳,江南,王净,李滨,吴明光.校园声景地图的数据处理与可视化设计[J].测绘科学,2023,48(6):222-230.

二级引证文献39

1程凤伟,王文剑,张珍珍.面向高维小样本数据的层次子空间ReliefF特征选择算法[J].南京大学学报（自然科学版）,2023,59(6):928-936.
2赵力,张昕然,梁瑞宇,王青云.数字助听器若干关键算法研究现状综述[J].数据采集与处理,2015,30(2):252-265. 被引量：9
3贺前华,潘伟锵,胡永健,朱铮宇,李艳雄,奉小慧.说话人认证录音回放检测方法综述[J].数据采集与处理,2015,30(2):266-274. 被引量：1
4杨彦,赵力.基于FVQMM的说话人识别方法[J].数据采集与处理,2015,30(6):1233-1239. 被引量：1
5包永强,梁瑞宇,丛韫,高冲红,王青云.音频取证若干关键技术研究进展[J].数据采集与处理,2016,31(2):252-259. 被引量：8
6袁飞,陈炜玲,李晔,程恩.水声语音通信体验质量的实时测量方法[J].数据采集与处理,2016,31(2):307-314. 被引量：3
7李亚克,田青,高航.结合类标签关联度的有序核判别回归学习[J].数据采集与处理,2016,31(3):532-540. 被引量：2
8余丹,吴小俊.一种卷积神经网络和极限学习机相结合的人脸识别方法[J].数据采集与处理,2016,31(5):996-1003. 被引量：19
9陈亚楠,王让定,陶表犁.基于低频区信息量分布的回放语音检测方法[J].数据通信,2016(6):37-41. 被引量：4
10李欣,许高建,李绍稳.一种优化的SVM竹类属种识别方法[J].重庆科技学院学报（自然科学版）,2017,19(5):98-101. 被引量：4

1王文忠.情感计算——和谐人机交互中的关键因素[J].福建电脑,2009,25(4):59-60. 被引量：1
2张亚利,睢丹.改进小波算法在图像分割技术中的应用[J].数字技术与应用,2016,34(3):137-138. 被引量：1
3骆逸欣,严志科,尹红炼.改进的点互信息微博情感分类方法[J].电脑与信息技术,2017,25(2):14-15. 被引量：3
4李玉鑑,张婷,胡海鹤.基于多层感知器的深度核映射支持向量机[J].北京工业大学学报,2016,42(11):1652-1661. 被引量：7
5耿志强,姬威,韩永明,曹健.基于维度最大熵数据流聚类的异常检测方法[J].控制与决策,2016,31(2):343-348. 被引量：10
6孟秀艳,王志良.基于非线性状态空间模型的情感模型研究[J].计算机科学,2008,35(12):178-182. 被引量：5
7孟秀艳,王志良,王丽娟.基于情感建模的教学辅助系统的研究[J].计算机应用研究,2007,24(4):74-76. 被引量：12
8刘宇松.基于支持向量机的Web代理缓存内容分类[J].科技与创新,2016(21):99-99.
9卢山,高峰,史广奎.并联型混合动力汽车的仿真研究[J].机电工程技术,2005,34(5):59-61. 被引量：3
10王志昊,王中卿,李寿山,李培峰,施寒潇.面向半监督情感分类的特征选择方法研究[J].中文信息学报,2013,27(6):96-102. 被引量：2

数据采集与处理

2012年第3期

浏览历史

内容加载中请稍等...

语音情感的维度特征提取与识别被引量：8

参考文献17

二级参考文献16

共引文献41

同被引文献79

引证文献8

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

语音情感的维度特征提取与识别 被引量：8

参考文献17

二级参考文献16

共引文献41

同被引文献79

引证文献8

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

语音情感的维度特征提取与识别被引量：8