一种结构化双注意力混合通道增强的跨模态行人重识别方法

A Cross-modal Person Re-identification Method Based on Hybrid Channel Augmentation with Structured Dual Attention

下载PDF

导出

摘要在目前跨模态行人重识别技术的研究中,大部分现有的方法会通过单模态原始可见光图像或者对抗生成图像的局部共享特征来降低跨模态差异,导致在红外图像判别中由于底层特征信息丢失而缺乏稳定的识别准确率。为了解决该问题,该文提出一种结构化双注意力可交换混合随机通道增强的特征融合跨模态行人重识别方法,利用通道增强后的可视图像作为第三模态,通过图像通道可交换随机混合增强(I-CSA)模块对可见光图像进行单通道和三通道随机混合增强抽取,从而突出行人的姿态结构细节,在学习中减少模态间差异。结构化联合注意力特征融合(SAFF)模块在注重模态间行人姿态结构关系的前提下,为跨模态表征学习提供更丰富的监督,增强了模态变化中共享特征的鲁棒性。在SYSU-MM01数据集全搜索模式单摄设置下Rank-1和mAP分别达到71.2%和68.1%,优于同类前沿方法。 In the current research on cross-modal person re-identification technology,most existing methods reduce cross-modal differences by using single modal original visible light images or locally shared features of adversarially generated images,resulting in a lack of stable recognition accuracy in infrared image discrimination due to the loss of feature information.In order to solve this problem,A cross-modal person re-identification method based on swappable hybrid random channel augmentation with structured dual attention is proposed.The visual image after channel enhancement is used as the third mode,and the single channel and three channels random hybrid enhancement extraction of visible image is performed through the Image Channel Swappable random mix Augmentation(I-CSA)module,so as to highlight the structural details of pedestrian posture,Reduce modal differences in learning.The Structured joint Attention Feature Fusion(SAFF)module provides richer supervision for cross-modal Feature learning,and enhances the robustness of shared features in modal changes,under the premise of focusing on the structural relationship of pedestrian attitudes between modes.Under the single shot setting of full search mode in the SYSU-MM01 dataset,Rank-1 and mAP reached 71.2%and 68.1%,respectively,surpassing similar cutting-edge methods.

作者庄建军庄宇辰 ZHUANG Jianjun;ZHUANG Yuchen(School of Electronic and Information Engineering,Nanjing University of Information Science and Technology,Nanjing 210044,China;Institute for AI in Medicine,School of Artificial Intelligence,Nanjing University of Information Science and Technology,Nanjing 210044,China)

机构地区南京信息工程大学电子与信息工程学院南京信息工程大学-中大医院智慧医疗研究院

出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期518-526,共9页 Journal of Electronics & Information Technology

基金国家重点研发计划(2021YFE0105500) 国家自然科学基金(62171228) 江苏高校“青蓝工程”。

关键词行人重识别跨模态混合通道增强联合注意力特征融合 Person Re-identification Cross-modal Hybrid channel enhancement Joint attention Feature fusion

分类号 TN911.73 [电子电信—通信与信息系统] TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1王凤随,闫涛,刘芙蓉,钱亚萍,许月.融合子空间共享特征的多尺度跨模态行人重识别方法[J].电子与信息学报,2023,45(1):325-334. 被引量：4
2徐胜军,刘求缘,史亚,孟月波,刘光辉,韩九强.基于多样化局部注意力网络的行人重识别[J].电子与信息学报,2022,44(1):211-220. 被引量：5

二级参考文献5

1周智恒,刘楷怡,黄俊楚,陈增群.一种基于等距度量学习策略的行人重识别改进算法[J].电子与信息学报,2019,41(2):477-483. 被引量：11
2陈鸿昶,吴彦丞,李邵梅,高超.基于行人属性分级识别的行人再识别[J].电子与信息学报,2019,41(9):2239-2246. 被引量：6
3罗浩,姜伟,范星,张思朋.基于深度学习的行人重识别研究进展[J].自动化学报,2019,45(11):2032-2049. 被引量：116
4杨婉香,严严,陈思,张小康,王菡子.基于多尺度生成对抗网络的遮挡行人重识别方法[J].软件学报,2020,31(7):1943-1958. 被引量：17
5王粉花,赵波,黄超,严由齐.基于多尺度和注意力融合学习的行人重识别[J].电子与信息学报,2020,42(12):3045-3052. 被引量：8

共引文献7

1许伟,翟煜锦.基于跨模态特征融合的行人重识别系统设计[J].信息与电脑,2022,34(12):179-181. 被引量：1
2赵安新,杨金桥,史新国,刘帅,师文,李学文.视觉行人重识别研究方法分析及评价指标探讨[J].西安科技大学学报,2022,42(5):1003-1012. 被引量：2
3张永飞,杨航远,张雨佳,豆朝鹏,廖胜才,郑伟诗,张史梁,叶茫,晏轶超,李俊杰,王生进.行人再识别技术研究进展[J].中国图象图形学报,2023,28(6):1829-1862. 被引量：2
4吴海丽,张月琴,庞俊奇.基于局部实例匹配无监督式学习的行人重识别[J].数据采集与处理,2023,38(4):947-958.
5杨永胜,邓淼磊,张德贤.基于IBN-Net和通道注意力的行人重识别方法[J].计算机工程与应用,2023,59(17):143-151.
6吴林涛,王文明.基于多维互信息特征的跨模态行人重识别方法[J].实验技术与管理,2023,40(12):82-91.
7夏冉,雷晓艳,郭梦晴,王文韬.基于身份导向自监督表示学习的智能寻人系统[J].周口师范学院学报,2024,41(2):50-54.

1徐胜军,荆扬,李海涛,段中兴,刘福友,李明海.渐进式多粒度ResNet车型识别网络[J].光电工程,2023,50(7):32-46. 被引量：1
2张政,何慧.一种改进的DETR输电线通道山火烟雾检测方法[J].小型微型计算机系统,2024,45(3):670-675.
3《数量经济技术经济研究》编辑部.《数量经济技术经济研究》“因果推断前沿方法”专题征稿启事[J].数量经济技术经济研究,2024,41(1).
4吴林涛,王文明.基于多维互信息特征的跨模态行人重识别方法[J].实验技术与管理,2023,40(12):82-91.
5潘如政,李怀宇,崔巍,曾鑫,张帅,邵涛.基于卷积神经网络与可视图像的类滑动放电模式识别[J].高电压技术,2024,50(1):423-431.
6《数量经济技术经济研究》编辑部.《数量经济技术经济研究》“因果推断前沿方法”专题征稿启事[J].数量经济技术经济研究,2024,41(2).
7陈亮,杨羽翼,张剑,吴亮红,时慧晶,彭辉.基于特征增强与损失优化的水下遮挡目标检测算法[J].探测与控制学报,2023,45(3):109-115. 被引量：2
8李文晶,孟昭博.基于模态参数的结构损伤识别研究进展[J].低温建筑技术,2023,45(11):94-97.
92024年组稿方向[J].计算机应用,2024,44(2).
10陈亮,陈利利,许海云,魏超,苏娜,尚玮姣.国内外专利挖掘研究进展与前瞻[J].图书情报工作,2024,68(2):110-133. 被引量：1

电子与信息学报

2024年第2期

浏览历史

内容加载中请稍等...

一种结构化双注意力混合通道增强的跨模态行人重识别方法

参考文献2

二级参考文献5

共引文献7

相关作者

相关机构

相关主题

浏览历史