基于韵律语段的语音情感识别方法研究被引量：8

Speech emotion recognition based on prosodic segment level features

导出

摘要语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。 In the field of speech emotion recognition,the emotion features of different emotional utterances are commonly extracted at the same segment length level.This ignores the variation of the human ear's sensitive prosodic segment length for different emotions.In the present system the best segment length for emotion recognition of each emotion was first obtained through experiments.A multi-network model named the prosodic segment level Elman network was then proposed to identify emotions using certain sensitive prosodic segment level features and then to combine the recognition results of each sub-network.Tests show that the recognition rate of sensitive prosodic segment level features is 67.9%,much higher than the rate obtained by fixed-length segment level features.

作者韩文静李海峰

机构地区哈尔滨工业大学计算机科学与技术学院

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第S1期1363-1368,共6页 Journal of Tsinghua University(Science and Technology)

基金高等学校博士学科点专项科研基金(20050213032) 国家自然科学基金资助项目(60772076) 国家"八六三"高技术项目(2006AA01Z197)

关键词情感特征敏感韵律段长语段特征 ELMAN神经网络语音情感识别 emotion features sensitive prosodic segment length segment level features Elman network speech emotion recognition

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3Schuller B,Reiter S,Muller R,et al.Speaker independentspeech emotion recognition by ensemble classification. Proc of ICME . 2005
4Slaney M,McRoberts G.A recognition system for affectivevocalization. Speech Communication . 2003
5Shami M T,Kamel M S.Segment-based approach to therecognition of emotions in speech. Proc of ICME . 2005
6Tao Jianhua,Kang Y G.Features importance analysis foremotional speech classification. Lecture Notes inComputer Science . 2005
7Schuller B,Rigoll G.Timing levels in segment-based speechemotion recognition. Proc of ICSLP . 2006
8Pantic M,Rothkrantz L J M.Toward an Affect-Sensitive Multimodal Human-Computer Interaction. Proceedings of Tricomm . 2003
9Lee C M,Narayanan S S.Toward Detecting Emotions in Spoken Dialogs. IEEE Transactions on Speech and Audio Processing . 2005
10Schuller B,Rigoll G,Lang M.Hidden Markov model-based speech emotion recognition. Proceedings of the2003IEEE International Conference on Acoustics,Speech,&Signal Processing . 2003

二级参考文献15

1蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：37
2王治平,赵力,邹采荣.基于基音参数规整及统计分布模型距离的语音情感识别[J].声学学报,2006,31(1):28-34. 被引量：26
3Picard R W. Affective Computing. Cambridge: MIT Press,1997
4Yoshitom Y, KIM S, Kawano T et al. Effect of sensor fusion for recognition of emotional states using voice, face image and thermal image of face. In: Proceedings, 9th IEEE International Workshop on Robot and Human Interactive communication, Osaka, 2000; 1:178-183
5Dellaert F, Polzin T, Waibel A. Recognizing emotion in speech. In: 4th International Conference on Spoken Language Processing, Philadelphia; 1996:1970-1973
6Yacoub S, Simske S, Lin X et al. Recognition of emotions in interactive voice response systems. Hewlett-Pachard Labratories HPL-2003-136, 2003
7Lin X, Chen Y, Lira Set al. Recognition of emotional state from spoken sentenses. In: IEEE 3rd Workshop on Multimedia Signal Processing, Copenhagen, 1999:469-473
8Breazeal C. Regulation and Entrainment in Human-Robot Interaction. International Journal of Robotic Research,2002; 21(10-11): 883-902
9Pao T, Chen Y, Ych Jet al. An exploratory study on emotion recognition in mandarin speech. In: 1st Chinese Conference on Affectie Computing and Intelligent Interaction, Bcijing, 2003; 1:206-212
10Bosch L T. Emotions; What is possible in the ASR framework. In: ISCA Workshop on Speech and Emotion,Belfast, 2000

共引文献41

1张石清,刘瑞欣,赵小明.跨库语音情感识别研究进展[J].计算机系统应用,2022,31(11):31-48.
2韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
3赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
4余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
5丁辉,唐振民,钱博,李燕萍.易扩展小样本环境说话人辨认系统的研究[J].系统仿真学报,2008,20(10):2779-2781.
6陈雪勤,赵鹤鸣,俞一彪.蚁群聚类神经网络的耳语音声调识别[J].应用科学学报,2008,26(5):511-515.
7孟庆梅,吴伟国.Artificial emotional model based on finite state machine[J].Journal of Central South University of Technology,2008,15(5):694-699. 被引量：4
8狄金海,赵艳,赵力.模糊矢量量化在语音情感识别中的应用[J].电声技术,2008,32(10):49-51.
9Zhao Yan Zhao Li Zou Cairong Yu Yinhua.SPEECH EMOTION RECOGNITION USING MODIFIED QUADRATIC DISCRIMINATION FUNCTION[J].Journal of Electronics(China),2008,25(6):840-844. 被引量：9
10陈雪勤,刘正,赵鹤鸣.基于相似度的高精度基音检测算法[J].声学技术,2008,27(5):704-707. 被引量：1

同被引文献98

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2黄力行,辛乐,赵礼悦,陶建华.自适应权重的双模态情感识别[J].清华大学学报（自然科学版）,2008,48(S1):715-719. 被引量：8
3张立华,杨莹春.情感语音变化规律的特征分析[J].清华大学学报（自然科学版）,2008,48(S1):652-657. 被引量：14
4赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432. 被引量：21
5蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：37
6淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
7王磊,邹北骥,彭小宁,周凌.一种改进的提取人脸面部特征点的AAM拟合算法[J].电子学报,2006,34(8):1424-1427. 被引量：13
8邵艳秋,韩纪庆,王卓然,刘挺.韵律参数和频谱包络修改相结合的情感语音合成技术研究[J].信号处理,2007,23(4):526-530. 被引量：7
9AYADI M E,KAMEL M S,KARRAY F.Survey on speech emotionrecognition:features,classification schemes and databases[J].Pat-tern Recognition,2011,44(3):572-587.
10YANG Bin,LUGGER M.Emotion recognition from speech signalsusing new harmony features[J].Signal Processing,2010,90(5):1415-1423.

引证文献8

1韩文静,李海峰,王朝友.语音情感信息可视化建模研究与探析[J].燕山大学学报,2010,34(2):128-132.
2余伶俐,周开军,邱爱兵.基于Elman神经网络的语音情感识别应用研究[J].计算机应用研究,2012,29(5):1809-1814. 被引量：4
3王薇,杨丽萍,魏丽,刘艳.语音情感特征的提取与分析[J].实验室研究与探索,2013,32(7):91-94. 被引量：11
4周夕良.语音情感识别的发展与展望[J].信息技术,2013,37(11):19-22. 被引量：1
5张明阳,查诚,塔什甫拉提.尼扎木丁,徐新洲,赵力.结合数据场情感空间和混合蛙跳算法的连续语音情感变化趋势检测[J].声学学报,2019,44(1):12-19. 被引量：5
6何俊,刘跃,何忠文.多模态情感识别研究进展[J].计算机应用研究,2018,35(11):3201-3205. 被引量：11
7潘涛,王胜利.基于不同算法的语音信号共振峰提取研究与实现[J].甘肃科技,2019,35(22):23-26.
8孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：14

二级引证文献46

1塔什甫拉提·尼扎木丁,梁瑞宇,谢跃,赵力.采用原子表示模型的维吾尔语语音情感识别[J].信号处理,2020,36(1):9-17. 被引量：3
2蔡萍.一种结合短时过零率的快速语音端点检测算法[J].厦门理工学院学报,2013,21(2):48-51. 被引量：3
3罗宪华,徐海明.基于特定人的语音情感识别系统构建[J].中国人民公安大学学报（自然科学版）,2015,21(4):72-75. 被引量：3
4梁瑞宇,王青云,赵力.嵌入式语音信号处理实验系统的设计与实现[J].实验室研究与探索,2017,36(5):126-130. 被引量：7
5王颖.基于改进Elman神经网络的语音情感识别技术研究[J].计算机与数字工程,2017,45(11):2131-2135. 被引量：1
6李文琴,尚雨琪,张巍.基于Matlab的语音情感特征值研究[J].实验室研究与探索,2018,37(7):131-135. 被引量：1
7唐闺臣,梁瑞宇,王杰.面向本科教育的语音情感识别实验设计与实现[J].大学教育,2018(9):105-107. 被引量：1
8韩福霞,储志高,舒彬,刘宏志,尹璐,丁仁山.基于storm云平台的电力信息系统实时监理的研究[J].电气应用,2015,34(S1):310-314. 被引量：2
9金升菊.基于稀疏表示的语音感情计算研究[J].电脑知识与技术,2018,14(9Z):171-172.
10金升菊.计算机科学视角的社会情感计算[J].管理观察,2018(33):60-61. 被引量：1

1韩文静,李海峰,韩纪庆.基于长短时特征融合的语音情感识别方法[J].清华大学学报（自然科学版）,2008,48(S1):708-714. 被引量：20
2阳爱民,周咏梅,周剑峰.中文微博语料情感类别自动标注方法[J].计算机应用,2014,34(8):2188-2191. 被引量：5
3林时来,刘光远,张慧玲.蚁群算法在呼吸信号情感识别中的应用研究[J].计算机工程与应用,2011,47(2):169-172. 被引量：5
4王秀,谢志成,张栋.一种基于特征差异度和SVM投票机制的数字音乐语音情感识别算法[J].福州大学学报（自然科学版）,2015,43(4):460-465. 被引量：2
5李杰,周萍.语音情感识别中特征参数的研究进展[J].传感器与微系统,2012,31(2):4-7. 被引量：2
6王素格,魏英.停用词表对中文文本情感分类的影响[J].情报学报,2008,27(2):175-179. 被引量：22
7陈智,李鹏.利用互信息和聚类抽样的文本情感分类[J].现代计算机（中旬刊）,2015(4):14-20. 被引量：2
8辛贤龙.结合情感信息的个性化推荐算法[J].微型电脑应用,2014,30(4):38-40.
9张洪强,刘光远,赖祥伟.随机森林算法在肌电的重要特征选择中的应用[J].计算机科学,2013,40(1):200-202. 被引量：15
10王磊,黄河笑,吴兵,郑任儿.基于主题与三支决策的文本情感分析[J].计算机科学,2015,42(6):93-96. 被引量：9

清华大学学报（自然科学版）

2009年第S1期

浏览历史

内容加载中请稍等...

基于韵律语段的语音情感识别方法研究被引量：8

参考文献13

二级参考文献15

共引文献41

同被引文献98

引证文献8

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于韵律语段的语音情感识别方法研究 被引量：8

参考文献13

二级参考文献15

共引文献41

同被引文献98

引证文献8

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于韵律语段的语音情感识别方法研究被引量：8