基于语音信号与文本信息的双模态情感识别被引量：8

Multimodal Emotion Recognition Based on Speech Signal and Text Information

下载PDF

导出

摘要情感识别已成为人机交互不可或缺的部分,目前单模态情感识别具有识别率低、可靠性差的特点,故提出一种融合语音信号与文本信息的双模态情感识别方法。首先,采集特定情感状态下的语音信号及文本信息;然后提取语音相关特征参数以及文本情感关键词特征参数并对其进行优化;最后,对两个单模态识别器的输出结果进行加权融合获得识别结果。针对所提算法进行了相关实验研究,结果表明双模态情感识别技术具有更高识别精度。 Emotion recognition has become an indispensable part of human-computer interaction. This paper propsesa fusion method of speech signal and the text information in emotion recognition,because of the low recognition rate and poor reliability of single modal emotion recognition. First of all,collecting specific emotional state of the speech signal and text information;then extracting the speech feature parameters and keywords emotional char acteristic parameters of text information and optimize it; finally, recognition results are obtained by weighted fusion of the output results of two single modal identification devices. According to the results of experimaental,it showed that the dualmodal emtoion recognition technology has higher recognition accuracy.

作者陈鹏展张欣徐芳萍 Chen Pengzhan Zhang Xin Xu Fangping(School of electrical and Automation Engineering, East China Jiaotong University, Nanchang 330013, China)

机构地区华东交通大学电气与自动化工程学院

出处《华东交通大学学报》 2017年第2期100-104,共5页 Journal of East China Jiaotong University

基金国家自然科学基金资助项目(61164011) 江西省研究生创新专项资金项目(YC2015-S242) 江西省博士后科研择优资助项目(2015KY19)

关键词语音信号文本识别参数优化高斯混合模型 speech signal text recognition parameter optimization gauss mixture model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：163
2张跃进,刘邦桂,谢昕.噪声背景下语音识别中的端点检测[J].华东交通大学学报,2007,24(5):135-138. 被引量：3
3申红,吕宝粮,内山将夫,井佐原均.文本分类的特征提取方法比较与改进[J].计算机仿真,2006,23(3):222-224. 被引量：28
4黄程韦,金赟,王青云,赵力,邹采荣.基于语音信号与心电信号的多模态情感识别[J].东南大学学报（自然科学版）,2010,40(5):895-900. 被引量：14
5叶云青,王长征,周日贵.基于最佳指数因子的自适应权值图像融合[J].华东交通大学学报,2011,28(2):74-79. 被引量：4

二级参考文献115

1胡江华,柏连发,张保民.象素级多传感器图像融合技术[J].南京理工大学学报,1996,20(5):453-456. 被引量：14
2李军,林宗坚.基于特征的遥感影像数据融合方法[J].中国图象图形学报（A辑）,1997,2(2):103-107. 被引量：51
3JOHN R J.陈晓玲(译).遥感数字影像处理导论[M].北京:机械工业出版社,2007.378-384.
4Zeng Z,Pantic M,Roisman G I,et al.A survey of affect recognition methods:audio,visual and spontaneous expressions[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(1):39-58.
5Hoch S,Althoff F,McGlaun A,et al.Bimodal fusion of emotional data in an automotive environment[C]//Proceedings of the 2005 IEEE International Conference on Acoustics,Speech,and Signal Processing.Philadelphia,Pennsylvania,USA,2005:1085-1088.
6Busso C,Deng Z,Yildirim S,et al.Analysis of emotion recognition using facial expressions,speech and multimodal information[C]//Proceedings of the Sixth International Conference on Multimodal Interfaces.Pennsylvania,USA,2004:205-211.
7Wagner J,Kim J,Andre E.From physiological signals to emotions:implementing and comparing selected methods for feature extraction and classification[C]//Proceedings of the 2005 IEEE International Conference on Multimedia & Expo.Amsterdam,the Netherlands,2005:940-943.
8Khiet T.How does real affect affect affect recognition in speech?[D].Enschede,the Netherlands:Center for Telematics and Information Technology of University of Twente,2009.
9Tato R,Santos R,Kompe R,et al.Emotion space improves emotion recognition[C]//Proceedings of the 2002 International Conference on Speech and Language Processing.Denver,Colorado,USA,2002:2029-2032.
10Schuller B,Rigoll G,Lang M.Speech emotion recognition combining acoustic features and linguistic information in a hybrid support vector machine-belief network architecture[C]//Proceedings of the 2004 IEEE International Conference on Acoustics,Speech,and Signal Processing.Montreal,Canada,2004:577-580.

共引文献206

1郑成杰,郑之.基于最大分类器差异域适应方法的3维点云分类[J].信息与控制,2023,52(5):588-597.
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3王荣荣.全局和局部特征提取相融合的中文文本特征提取方法研究[J].河北北方学院学报（自然科学版）,2013,29(3):35-38.
4李兆翠,刘培玉,周洪利.基于贝叶斯方法的客户端邮件过滤器的设计与实现[J].信息技术与信息化,2007(3):90-92. 被引量：1
5李新福.组合降维技术在中文网页分类中的应用[J].计算机工程与应用,2007,43(24):169-171. 被引量：3
6张元虹,郭剑毅,龚华明,薛征山.基于DF与LSA相结合的降维法的文本分类系统的研究[J].山西电子技术,2008(4):3-4. 被引量：1
7郑雅婷,张鹰.Web文本挖掘技术在网上购物中的应用[J].牡丹江师范学院学报（自然科学版）,2008,34(4):11-13.
8熊忠阳,蒋健,张玉芳.新的CDF文本分类特征提取方法[J].计算机应用,2009,29(7):1755-1757. 被引量：11
9王培涌,陈好刚,王树峰.一种改进的中文文本特征选择方法[J].现代计算机,2009,15(12):75-77.
10夏晶晶,朱颢东.基于特征辨别能力和分形维数的特征选择方法[J].微型机与应用,2010,29(7):68-71. 被引量：2

同被引文献42

1付丽琴,毛峡,陈立江.基于改进的排序式选举算法的语音情感融合识别[J].计算机应用,2009,29(2):381-385. 被引量：1
2王寅,储泽祥.“我的妈呀/我的天哪”的选择倾向及制约因素[J].汉语学报,2011(1):7-15. 被引量：7
3申红,吕宝粮,内山将夫,井佐原均.文本分类的特征提取方法比较与改进[J].计算机仿真,2006,23(3):222-224. 被引量：28
4徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：376
5石瑛,胡学钢.基于神经网络的语音情感识别[J].计算机工程与应用,2008,44(24):191-193. 被引量：9
6石瑛,胡学钢,方磊.基于决策树的多特征语音情感识别[J].计算机技术与发展,2009,19(1):147-149. 被引量：4
7黄程韦,金赟,王青云,赵力,邹采荣.基于语音信号与心电信号的多模态情感识别[J].东南大学学报（自然科学版）,2010,40(5):895-900. 被引量：14
8赵宪章.语图互仿的顺势与逆势——文学与图像关系新论[J].中国社会科学,2011(3):170-184. 被引量：129
9屠岸.我的惊讶与震撼[J].博览群书,2012(1):10-12. 被引量：1
10韩志艳,伦淑娴,王健.基于遗传小波神经网络的语音情感识别[J].计算机技术与发展,2013,23(1):75-78. 被引量：5

引证文献8

1张力行,叶宁,黄海平,王汝传.基于皮肤电信号与文本信息的双模态情感识别系统[J].计算机系统应用,2018,27(11):103-108. 被引量：1
2胡婷婷,沈凌洁,冯亚琴,王蔚.语音与文本情感识别中愤怒与开心误判分析[J].计算机技术与发展,2018,28(11):124-127. 被引量：5
3万光荣.惊讶程度的多模态研究[J].湖南师范大学社会科学学报,2019,48(2):110-116. 被引量：2
4冯亚琴,沈凌洁,胡婷婷,王蔚.利用语音与文本特征融合改善语音情感识别[J].数据采集与处理,2019,34(4):625-631. 被引量：3
5冯晓静,白静,薛珮芸,戎如意.基于双模态融合特征的模糊语音识别研究[J].电子设计工程,2022,30(2):43-48. 被引量：3
6王兰馨,王卫亚,程鑫.结合Bi-LSTM-CNN的语音文本双模态情感识别模型[J].计算机工程与应用,2022,58(4):192-197. 被引量：12
7辛苗苗,马丽,胡博发.跨模态交互信息的双模态情感识别[J].福建电脑,2022,38(11):82-84.
8李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024,44(1):86-93.

二级引证文献26

1陈诗汉,马洪江,王婷,何松泽.基于多模态融合的视频情感分析技术[J].成都信息工程大学学报,2022,37(6):656-661. 被引量：1
2王蔚,胡婷婷,冯亚琴.基于深度学习的自然与表演语音情感识别[J].南京大学学报（自然科学版）,2019,55(4):660-666. 被引量：15
3孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：14
4张兴旺,郝彦娜,王璐.面向听障用户的数字图书馆信息无障碍智能交互技术研究述评[J].图书馆学研究,2020(21):2-12. 被引量：5
5苏超,王国中.课堂场景下学习者情感识别研究[J].智能计算机与应用,2020,10(11):8-15. 被引量：1
6刘继明,张培翔,刘颖,张伟东,房杰.多模态的情感分析技术综述[J].计算机科学与探索,2021,15(7):1165-1182. 被引量：28
7王兰馨,王卫亚,程鑫.结合Bi-LSTM-CNN的语音文本双模态情感识别模型[J].计算机工程与应用,2022,58(4):192-197. 被引量：12
8李瑞航,吴红兰,孙有朝,吴华聪.基于深度残差收缩网络多特征融合语音情感识别[J].数据采集与处理,2022,37(3):542-554. 被引量：2
9赵小明,杨轶娇,张石清.面向深度学习的多模态情感识别研究进展[J].计算机科学与探索,2022,16(7):1479-1503. 被引量：9
10刘彦.基于压缩域特征的多媒体数字音频检索方法[J].信息记录材料,2022,23(8):229-231.

1闫静杰,郑文明,辛明海,邱伟.表情和姿态的双模态情感识别[J].中国图象图形学报,2013,18(9):1101-1106. 被引量：15
2王晓华,侯登永,胡敏,任福继.复合时空特征的双模态情感识别[J].中国图象图形学报,2017,22(1):39-48. 被引量：5

华东交通大学学报

2017年第2期

浏览历史

内容加载中请稍等...

基于语音信号与文本信息的双模态情感识别被引量：8

参考文献5

二级参考文献115

共引文献206

同被引文献42

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于语音信号与文本信息的双模态情感识别 被引量：8

参考文献5

二级参考文献115

共引文献206

同被引文献42

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于语音信号与文本信息的双模态情感识别被引量：8