基于交叉自注意力的多模态图像融合方法

下载PDF

导出

摘要为了提高多模态图像的融合效果,提出一种基于交叉自注意力的多模态图像融合网络,主要利用卷积运算和视觉Transformer的优势进行多模态的图像数据融合。网络采用了双分支结构,首先,将可见光图像与红外图像分别经过相同的卷积模块获取模态特征,为了更有效地学习不同模态图像间的局部关联信息和全局关联信息。其次,将输入图像特征转化为序列模块特征后输入Transformer模块,采用交叉自注意力机制模拟Transformer模块中不同模态图像的对应关系,增加数据解析的维度,提高融合网络对全局信息的保留;然后设计了一个自残差空洞卷积连接网络,用于获得卷积过程中忽略的局部重要信息,增强网络对重点信息的提取能力;最后将融合得到的特征信息通过后续的卷积神经网络获得融合后的图像。为验证方法的有效性,在多模态数据集MS-COCO中的两个公开的红外和可见光图像数据集、磁共振成像和正电子放射断层造影术数据集上进行了大量的实验,并进行定性和定量分析,结果表明,所提出的模型相较于主流融合方法能够取得更好地融合效果。

作者杜群江亚峰王占光袁明新

机构地区江苏科技大学苏州理工学院张家港江苏科技大学产业技术研究院

出处《装备制造技术》 2024年第9期21-25,共5页 Equipment Manufacturing Technology

关键词多模态图像融合 Transformer模块卷积神经网络交叉自注意力

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1李一鸣,王昊,李然,陈泉,卢海军,杨晖.基于Trans-MIR模型的多模态图像重建[J].光学仪器,2024,46(5):51-57.
2薛锦晶.空管雷达校飞智能分析软件设计与开发[J].中国宽带,2023,19(11):55-57.
3杨卫明,张伟豪,余磊.一种多尺度残差注意力Unet-Like网络的医学图像融合方法[J].重庆师范大学学报（自然科学版）,2024,41(4):126-138.
4樊子恒.智能化矿山数据中台构建与关键技术研究[J].煤矿安全,2024,55(9):217-224.
5白宏权.基于模糊逻辑的铁路机车无线通信接入拥塞控制系统设计[J].计算机测量与控制,2024,32(10):104-110.
6Man-Jing Ma,Wen-Chao Yu,Huai-Ying Sun,Bing-Cheng Dong,Gang-Ao Hu,Zhen-Yi Zhou,Yi Hua,Buddha Bahadur Basnet,Yan-Lei Yu,Hong Wang,Bin Wei.Genus-specific secondary metabolome in Allokutzneria and Kibdelosporangium[J].Synthetic and Systems Biotechnology,2024,9(3):381-390.

装备制造技术

2024年第9期

浏览历史

内容加载中请稍等...

基于交叉自注意力的多模态图像融合方法

相关作者

相关机构

相关主题

浏览历史