基于堆叠交叉注意力CLIP的多模态情感分析

Multi-modal Sentiment Analysis Based on Stacked Cross-attention CLIP

下载PDF

导出

摘要现有的多模态情感分析方法大多都是采用不同的模型来提取特征,模型之间特征的提取都是独立的过程,并且由于不同模态之间天然跨度较大,导致后续模态也难以有效融合,为了充分利用多模态信息,实现更有效的模态交互。为此提出了SCA-CLIP框架,即基于对比语言-图像预训练(CLIP)的多模态情绪分析网络。我们使用基于CLIP的编码器从图像和文本中提取强相关的深度表示,之后利用设计的堆叠交叉注意机制对跨模态的信息进行充分的交互以及融合,并且整个模型中通过利用BERT的多头注意力机制来维护可学习向量序列来捕捉有效信息,最后对典型的情绪分析数据集进行了广泛的实验。结果表明,所提出的框架在挖掘多模态情绪分析的关键特征方面具有更好的能力,能实现比原来更好的性能,即在MVSA-Single和MVSA-Multiple上的整体准确率分别提高了2.51%和1.3%。 Most of the existing multi-modal sentiment analysis methods use different models to extract features,and the extraction of features between models are independent processes.Due to the large natural span between different modes,it is difficult to effectively integrate the subsequent modes.In order to make full use of multi-modal information and realize more efficient modal interaction,SCA-CLIP framework is proposed,which is a multi-modal sentiment analysis network based on contrastive language-image pre-training(CLIP).CLIP-based encoders are used to extract strongly correlated deep representations from images and texts,and then the designed stacked cross-attention mechanism is used to fully interact as well as fuse the cross-modal information,and a sequence of learnable vectors throughout the model is maintained to capture effective information by using the multi-headed attention mechanism of BERT,and finally extensive experiments on a typical sentiment analysis dataset are conducted.The results show that the proposed framework has better capability in mining the key features of multi-modal sentiment analysis and can achieve better performance than previous work,the overall accuracy on MVSA-Single,MVSA-Multiple is improved by 2.51%and 1.3%,respectively.

作者汪召凯叶勇汪子文 Wang Zhaokai;Ye Yong;Wang Ziwen(School of Information and Artificial Intelligence,Anhui Agricultural University,Hefei,Anhui 230036,China)

机构地区安徽农业大学信息与人工智能学院

出处《黑龙江工业学院学报（综合版）》 2023年第11期97-104,共8页 Journal of Heilongjiang University of Technology(Comprehensive Edition)

基金安徽省高等学校质量工程项目“服务安徽省新一代信息技术的产教融合模式创新项目”(项目编号:2022sdxx012) 安徽省教育厅高校省级人文社会科学研究重点项目(项目编号:2023AH050966)。

关键词多模态情感分析图文交互 BERT CLIP 注意力机制 multi-modal sentiment analysis image-text interaction BERT CLIP attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1阳锋,冯时,王琳,李任斐,王大玲,于戈.MICA:一个面向微博数据流的观点挖掘原型系统[J].计算机研究与发展,2011,48(S3):405-409. 被引量：6
2张亚洲,戎璐,宋大为,张鹏.多模态情感分析研究综述[J].模式识别与人工智能,2020,33(5):426-438. 被引量：30
3张玲,吴发辉.基于多模态融合的加权网络重叠社区划分算法[J].黑龙江工业学院学报（综合版）,2021,21(8):98-103. 被引量：3

二级参考文献24

1李兵,韩睿,何怡刚,张晓艺,侯金波.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319. 被引量：78
2Lowe D.Object Recognition from Local Scale-Invariant Features[].Proceedings of the International Conference on Computer Vision.1999
3KU L W,CHEN H H.Mining Opinions from the Web:beyond Relevance Retrieval[].Journal of American Society for Information Science and Technology.2007
4ICTCLA. http://www.ictclas.org/ . 2011
5.HowNet[]..2011
6谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1):73-83. 被引量：199
7朱征宇,袁闯.融入H指数的局部拓展类重叠社区发现算法[J].小型微型计算机系统,2019,40(1):20-25. 被引量：2
8王斌,李强,盛津芳,孙泽军.基于边图的线性流重叠社区发现算法[J].计算机工程与应用,2019,55(2):60-66. 被引量：5
9潘剑飞,董一鸿,陈华辉,钱江波,戴明洋.基于结构紧密性的重叠社区发现算法[J].电子学报,2019,47(1):145-152. 被引量：15
10滕飞,戴荣杰,任晓春.复杂网络的重叠社区发现并行算法[J].西南交通大学学报,2019,54(1):211-218. 被引量：3

共引文献35

1王开心,徐秀娟,刘宇,赵哲焕,赵小薇.在线评论的静态多模态情感分析[J].应用科学学报,2022,40(1):25-35. 被引量：2
2肖珺,黄枫怡.情感分析在跨文化传播研究中的方法意义:源流、应用与反思[J].中华文化与传播研究,2022(1):82-93. 被引量：1
3饶洁.基于内容的移动社交网络审计分析引擎[J].电脑知识与技术,2014(4):2423-2427.
4陆柳杏,吴丹.基于视觉注意力的图像情感研究框架[J].图书情报知识,2020(6):101-108. 被引量：5
5李慧.面向学习体验文本的学习者情感分析模型研究[J].远程教育杂志,2021,39(1):94-103. 被引量：25
6孟祥瑞,杨文忠,王婷.基于图文融合的情感分析研究综述[J].计算机应用,2021,41(2):307-317. 被引量：12
7王雨竹,谢珺,陈波,续欣莹.基于跨模态上下文感知注意力的多模态情感分析[J].数据分析与知识发现,2021,5(4):49-59. 被引量：10
8林镇涛,曾碧,潘志豪,文松.基于双流网络的多模态多标签漫画情感检测方法[J].模式识别与人工智能,2021,34(11):1017-1027. 被引量：1
9董克,吴佳纯.引文情感分析方法研究综述[J].图书情报知识,2021,38(6):60-72. 被引量：5
10姜宇桐,钱雪忠,宋威.MASGC:融合特定屏蔽机制的简单图卷积情感分析模型[J].计算机应用研究,2022,39(4):1049-1053. 被引量：2

1周铮.CMP抛光材料:先进制程提振需求国产替代空间广阔[J].股市动态分析,2023(21):52-53. 被引量：1
2张清泉.基于信息科技核心素养培养的人工智能项目教学研究——以《设计开发人工智能产品》一课为例[J].教育信息技术,2023(12):16-20.

黑龙江工业学院学报（综合版）

2023年第11期

浏览历史

内容加载中请稍等...

基于堆叠交叉注意力CLIP的多模态情感分析

参考文献3

二级参考文献24

共引文献35

相关作者

相关机构

相关主题

浏览历史