基于多模态融合的情绪识别

下载PDF

导出

摘要多模态情绪识别利用语音、文本、图像等多种数据形式,通过综合分析这些数据中的情绪信息来识别人类的情绪状态。相较于单一模态的情绪识别,这种方法能更全面地捕捉情绪的复杂性和微妙差异。为提高从特征提取到情绪分类的高效性,提出了一种端对端的网络结构,直接利用音频与视频数据进行特征提取和情绪识别,并通过实验比较了三种不同的特征融合方法。实验结果表明,改进中间注意力融合方法在RAVDESS测试集上取得了71.67%的最高平均准确率,显示出优于其他融合策略的性能。

作者廖强王宇

机构地区中国民用航空飞行学院

出处《科技传播》 2024年第7期12-15,共4页 Public Communication of Science & Technology

关键词情绪识别 TRANSFORMER ATTENTION 多模态融合

分类号 G2 [文化科学]

引文网络
相关文献

1顾春睿,刘银华,赵祥涛.基于骨骼关键点的室外群体情绪识别[J].传感器与微系统,2024,43(4):119-123.

科技传播

2024年第7期

浏览历史

内容加载中请稍等...

基于多模态融合的情绪识别

相关作者

相关机构

相关主题

浏览历史