基于表情和语音的多模态情感识别研究被引量：3

Multi-modal Emotion Recognition Based on Video and Audio

下载PDF

导出

摘要由于单一特征的局限性,单一模态的情感识别研究往往由于含有的有效信息量较少或含有的噪声信息过多而导致识别结果与实际情况有着较大的差异。而不同类型的输入特征,相对于单一特征而言,包含着充分的、互补的情感信息。因此,本研究基于eNTERFACE数据库,提取了SIFT特征作为表情特征数据以及使用openSMILE工具包提取的1 582维声学及统计特征作为语音特征数据,分别运用支持向量机SVM和稀疏表示SR方法进行情感识别。最后采用决策层融合的方式,在该数据库上获得了比较好的效果。 Single modality is usually far from satisfactory due to insufficient data or overmuch noi ferent sensors may carry redundant, complementary information, and lead to improve the performance. fore we use eNTERFACE database, extract the SIFT feature as the face emotion feature and using open tools extract 1582 dimension speech feature, and classify by the SVM and SR. Finally we fuse the mu on the score level, and achieve the best recognition results. se. Dif- There- SMILE ltimodal

作者王蓓王晓兰

机构地区东南大学学习科学研究中心

出处《信息化研究》 2014年第1期48-50,共3页 INFORMATIZATION RESEARCH

关键词多模态视频语音情感识别 Multi-modal video audio emotion recognition

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献17

1Gajsek R, Struc V, Mihelic F. Multi-modal emotion recogni- tion using canonical correlations and acoustic features[C]//Pattern recognition(ICPR),2010 20th International confer- ence on. IEEE,2010:4133 - 4136.
2Wang Y, Guan L, Venetsanopoulos A N. Kernel cross-mo- dal factor analysis for information fusion with application to bimodal emotion recognition[J]. Multimedia, IEEE Trans- actions on, 2012,14 (3) : 597 - 607.
3Paleari M, H uet B, Chellali R. Towards multimodal emotion recognition:a new approaeh[C]//Proceedings of the ACM international conference on image and video retrieval. ACM, 2010 : 174 - 181.
4Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International journal of computer vision, 2004,60(2) :91 - 110.
5Yang J, Yu K, Gong Y, et al. Linear spatial pyramid matc- hing using sparse coding for image cIassification[C]//Com- puter vision and pattern recognition, CVPR 2009. IEEE Conference on. IEEE, 2009:1794- 1801.
6Cortes C, Vapnik V. Support-vector networks[J]. Machine learning, 1995,20(3) .. 273 - 297.
7Pao T, Chen Y, Yeh J. Emotion recognition and evaluation from mandarin speech signals[J]. International journal of innovative computing, Information and Control, 2008,4 (7) : 1695 - 1709.
8Eyben F, WOllmer M, Schuller B. Opensmile. the munich versatile and fast open-source audio feature extractor [C]// Proceedings of the international conference on Multimedia. ACM,2010: 1459 - 1462.
9Wright J, Yang A Y, Ganesh A, et al. Robust face recogni- tion via sparse representation[J]. Pattern analysis and ma- chine intelligence, IEEE Transactions on, 2009,31 (2) : 210 - 227.
10Martin O,Kotsia I,Macq B,et al. The enterface'05 audio- visual emotion database [C]//Data engineering work- shops, 2006. Proceedings. 22nd international conference on. IEEE,2006 : 8 - 8.

同被引文献4

1闫静杰,郑文明,辛明海,邱伟.表情和姿态的双模态情感识别[J].中国图象图形学报,2013,18(9):1101-1106. 被引量：15
2赵国朕,宋金晶,葛燕,刘永进,姚林,文涛.基于生理大数据的情绪识别研究进展[J].计算机研究与发展,2016,53(1):80-92. 被引量：42
3闫静杰,卢官明,李海波,王珊珊.基于人脸表情和语音的双模态情感识别[J].南京邮电大学学报（自然科学版）,2018,38(1):60-65. 被引量：12
4林巧民,齐柱柱.基于HMM和ANN混合模型的语音情感识别研究[J].计算机技术与发展,2018,28(10):74-78. 被引量：9

引证文献3

1闫静杰,卢官明,李海波,王珊珊.基于人脸表情和语音的双模态情感识别[J].南京邮电大学学报（自然科学版）,2018,38(1):60-65. 被引量：12
2林巧民,潘敏.基于模糊聚类的“愤怒”表情细分方法研究[J].计算机技术与发展,2020,30(1):44-49. 被引量：2
3宋冠军,张树东,卫飞高.音视频双模态情感识别融合框架研究[J].计算机工程与应用,2020,56(6):140-146. 被引量：8

二级引证文献22

1黄晶云.基于知识管理的企业档案管理发展策略[J].办公自动化,2020(17):48-49. 被引量：1
2葛继科,刘灿.基于情绪识别的课堂氛围评价系统设计与实现[J].办公自动化,2020(17):43-45. 被引量：1
3万光荣.惊讶程度的多模态研究[J].湖南师范大学社会科学学报,2019,48(2):110-116. 被引量：2
4龚礼林,刘红霞,赵蔚,刘阳.情感导学系统(ATS)的关键技术及其导学模型研究——论智能导学系统走向情感导学系统之意蕴[J].远程教育杂志,2019,37(5):45-55. 被引量：7
5卢官明,程晓,李霞,闫静杰,李海波.基于遗传算法的多模态情感特征融合方法[J].南京邮电大学学报（自然科学版）,2019,39(5):41-47. 被引量：7
6宋冠军,张树东,卫飞高.音视频双模态情感识别融合框架研究[J].计算机工程与应用,2020,56(6):140-146. 被引量：8
7贾俊佳,蒋惠萍,张廷.多模态情感识别综述[J].中央民族大学学报（自然科学版）,2020,29(1):54-58. 被引量：9
8刘菁菁,吴晓峰.基于长短时记忆网络的多模态情感识别和空间标注[J].复旦学报（自然科学版）,2020,59(5):565-574. 被引量：8
9卢官明,丛文康,魏金生,闫静杰.基于CNN和LSTM的脑电信号情感识别[J].南京邮电大学学报（自然科学版）,2021,41(1):58-64. 被引量：10
10朱龙珠,田诺,张全.基于语义分析的语音情感在线识别方法研究[J].电子设计工程,2021,29(11):151-154. 被引量：1

1李翔宇,金梁,黄开枝,吉江.基于联合信道特征的中继物理层安全传输机制[J].计算机学报,2012,35(7):1399-1406. 被引量：5
2钟菲,赵悦,张天,张学敏,郭树旭.基于压缩感知重建去噪后的LDPC译码算法[J].云南大学学报（自然科学版）,2015,37(5):680-686. 被引量：1
3尹乐.浅析电视信号高清晰度数字技术的发展[J].装备制造,2009(12):103-103. 被引量：2
4徐波,葛建华.软判决译码中软信息的提取[J].通信技术,2002,35(12X):20-22. 被引量：2
5袁艳红.测三极管特性的改进电路[J].物理实验,2001,21(9):35-35.
6蔡海燕.基于高清技术的地铁视频监控系统的应用分析[J].科技视界,2012(26):84-87. 被引量：16
7周萍,唐李珍.基于信息融合的短语音说话人识别方法研究[J].计算机工程,2011,37(2):169-171. 被引量：3
8吴克桐,王永丰,李磊,蔡惠智.利用支持向量机提高水声信号的检测能力[J].声学技术,2009,28(3):222-226.
9贾宇平,付耀文,庄钊文.基于K近邻决策分布图的决策层融合目标识别[J].系统工程与电子技术,2005,27(11):1921-1923. 被引量：1
10卢光跃,陈思俊,孙宇.基于波达方向估计的频谱感知算法[J].西安邮电大学学报,2015,20(6):19-22.

信息化研究

2014年第1期

浏览历史

内容加载中请稍等...

基于表情和语音的多模态情感识别研究被引量：3

参考文献17

同被引文献4

引证文献3

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于表情和语音的多模态情感识别研究 被引量：3

参考文献17

同被引文献4

引证文献3

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于表情和语音的多模态情感识别研究被引量：3