-
题名结合多种注意力机制的多模态情感识别方法
- 1
-
-
作者
史爱武
蔡润
-
机构
武汉纺织大学计算机与人工智能学院
-
出处
《软件导刊》
2023年第10期105-109,共5页
-
文摘
多模态语音情感识别需要全面理解对讲话者话语的内容(文本信息)以及说话的方式(声学信息),但如何有效融合语音和文本两种模态的特征是一个具有挑战性的问题。为此,提出一种基于双向循环门控单元和多种注意力的多模态情感识别模型。该模型首先使用双向循环门控单元提取语音和文本模态的特征,然后使用由并行的自注意力模块和引导注意力模块组成的多模态特征融合网络捕获模态内及模态间的交互关系,以使模型在训练学习过程中能同时关注到模态间及模态内重要的交互特征,进而增强模型的表示能力。在IEMOCAP数据集上对所提模型进行评估,结果表明该模型的情感分类结果相比其他方法明显提升。
-
关键词
多模态情感识别
双向循环门控单元
引导注意力模块
自注意力模块
特征融合
-
Keywords
multimodal emotion recognition
bidirectional circulation gating unit
guide attention module
self-attention module
fusion of features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多尺度级联注意网络的肺实质分割
被引量:1
- 2
-
-
作者
许圳兴
余耀
赵东
陈园
范圣旺
-
机构
南京信息工程大学电子与信息工程学院
无锡学院电子与信息工程学院
杭州海康威视数字技术股份有限公司
-
出处
《国外电子测量技术》
2024年第5期60-69,共10页
-
基金
江苏省高等学校基础科学(自然科学)研究面上省资助经费项目(22KJB140017)
无锡学院人才启动基金(2019r015,2022r006)项目资助。
-
文摘
针对肺实质分割任务中不同尺度特征的全局上下文信息利用率低、分割精度低、分割细节模糊等问题,提出一种多尺度级联注意网络(multiscale cascaded attention networks,MCANet)。该网络主要由多尺度特征提取网络(multi-scale feature extraction network,MSFENet)、多尺度注意力引导模块(multi-scale attention guidance module,MSAG)、解码特征整合器(decoding feature integrator,DFI)组成。首先,设计MSFENet以提高特征信息在不同通道维度上的空间交互能力,在采样过程中最大限度地保留图像的关键特征,丰富全局上下文信息。然后,设计MSAG提高模型在解码过程中对多尺度特征信息的利用率,并最大限度地融合两种注意力机制的优势。最后设计DFI,重新整合解码器生成的解码特征,以提高模型对边缘信息的分割性能。在LUNA16数据集上对模型性能进行实验验证,得到了0.993的Dice和3.864的HD,实验结果证明了MCANet与其他主流医学分割模型相比有更优异的分割性能,能更准确地分割肺实质。
-
关键词
肺实质分割
多尺度级联注意网络
多尺度特征提取网络
多尺度注意力引导模块
解码特征整合器
-
Keywords
lung parenchymal segmentation
MCANet
MSFENet
MSAG
DFI
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-