-
题名基于堆叠交叉注意力CLIP的多模态情感分析
- 1
-
-
作者
汪召凯
叶勇
汪子文
-
机构
安徽农业大学信息与人工智能学院
-
出处
《黑龙江工业学院学报(综合版)》
2023年第11期97-104,共8页
-
基金
安徽省高等学校质量工程项目“服务安徽省新一代信息技术的产教融合模式创新项目”(项目编号:2022sdxx012)
安徽省教育厅高校省级人文社会科学研究重点项目(项目编号:2023AH050966)。
-
文摘
现有的多模态情感分析方法大多都是采用不同的模型来提取特征,模型之间特征的提取都是独立的过程,并且由于不同模态之间天然跨度较大,导致后续模态也难以有效融合,为了充分利用多模态信息,实现更有效的模态交互。为此提出了SCA-CLIP框架,即基于对比语言-图像预训练(CLIP)的多模态情绪分析网络。我们使用基于CLIP的编码器从图像和文本中提取强相关的深度表示,之后利用设计的堆叠交叉注意机制对跨模态的信息进行充分的交互以及融合,并且整个模型中通过利用BERT的多头注意力机制来维护可学习向量序列来捕捉有效信息,最后对典型的情绪分析数据集进行了广泛的实验。结果表明,所提出的框架在挖掘多模态情绪分析的关键特征方面具有更好的能力,能实现比原来更好的性能,即在MVSA-Single和MVSA-Multiple上的整体准确率分别提高了2.51%和1.3%。
-
关键词
多模态情感分析
图文交互
BERT
CLIP
注意力机制
-
Keywords
multi-modal sentiment analysis
image-text interaction
BERT
CLIP
attention mechanism
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP391.1
[自动化与计算机技术—计算机应用技术]
-