结合数据增强与特征融合的跨模态行人重识别

Cross-Modality Person Re-identification Combined with Data Augmentation and Feature Fusion

下载PDF

导出

摘要可见光-红外行人重识别问题的难点在于图像间模态差异大,大多数现有的方法通过生成对抗网络生成伪图像或提取原始图像上的模态共享特征来缓解模态差异。然而,训练生成对抗网络需要消耗大量的计算资源且生成的伪图像容易引入噪声,提取模态共享特征也会不可避免地导致与行人身份相关的重要判别特征丢失。针对以上问题,提出新的跨模态行人重识别网络。首先将进行自动数据增强后的训练数据集作为网络输入,提高模型的鲁棒性;然后在网络中引入实例正则化来缩小模态差异;最后将网络各层提取到的不同尺度的行人特征进行有机融合,融合后的特征包含更多与行人身份相关的判别特征。该方法在SYSU-MM01数据集的全局搜索模式下Rank-1/mAP分别达到69.47%/65.05%,在RegDB数据集的可见光到红外模式下Rank-1/mAP分别达到85.73%/77.77%,实验结果获得显著提升。 The difficulty of visible-infrared person re-identification problem lies in the large modal difference between images.Most existing methods alleviate the modal difference by generating fake images through generative adversarial networks or extracting modal shared features on the original image.However,training a generative adversarial network consumes a lot of computational resources and generates fake images that are prone to introduce noise,and extracting modal shared features can also result in the loss of important differentiated features.To address these problems,a new crossmodality person re-identification network is proposed.Firstly,automatic data augmentation is used to improve model robustness.Then,instance regularization is used in the network to reduce modal differences.Finally,the pedestrian features of different scales extracted by each layer of the network are organically fused,and the fused features contain more differentiated features related to pedestrian identity.The proposed method achieves Rank-1/mAP of 69.47%/65.05%in the allsearch mode of the SYSU-MM01,and Rank-1/mAP of 85.73%/77.77%in the visible to infrared modes of the RegDB,respectively.The experimental results have a significant improvement effect.

作者宋雨王帮海曹钢钢 SONG Yu;WANG Banghai;CAO Ganggang(College of Computer Science,Guangdong University of Technology,Guangzhou 510006,China)

机构地区广东工业大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第4期133-141,共9页 Computer Engineering and Applications

基金国家自然科学基金面上项目(62072119)。

关键词跨模态行人重识别自动数据增强特征融合 cross-modality person re-identification automatic data augmentation feature fusion

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1肖雅妮,范馨月,陈文峰.多分支融合局部特征的行人重识别算法[J].计算机工程与应用,2021,57(18):213-219. 被引量：7

二级参考文献3

1崔鹏,赵莎莎,范志旭.行人检测的深度稀疏自编码网络[J].计算机科学与探索,2019,13(6):1027-1037. 被引量：4
2徐家臻,李婷,杨巍.多尺度局部特征选择的行人重识别算法[J].计算机工程与应用,2020,56(2):141-145. 被引量：10
3徐思敏,胡士强.多属性融合网络的行人重识别方法[J].计算机工程与应用,2020,56(6):126-132. 被引量：5

共引文献6

1王黎明,孙俊,陈祺东.加强重识别的行人多目标跟踪算法[J].计算机工程与应用,2022,58(21):213-222. 被引量：4
2朱亚梅,施一萍,江悦莹,邓源,刘瑾.结合MASP和语义分割的双链路行人重识别方法[J].计算机工程与应用,2022,58(24):143-150.
3杨永胜,邓淼磊,张德贤.基于IBN-Net和通道注意力的行人重识别方法[J].计算机工程与应用,2023,59(17):143-151. 被引量：2
4闫昊雷,李小春,秦先祥,付弋颉.基于局部特征注意力的行人重识别方法[J].计算机与数字工程,2023,51(7):1529-1533.
5吴林涛,王文明.基于多维互信息特征的跨模态行人重识别方法[J].实验技术与管理,2023,40(12):82-91.
6白宗文,张哲.行人重识别模型的多任务损失设计[J].西安科技大学学报,2024,44(2):400-408.

1郝建琛.生成式媒介ChatGPT之下意识形态领域的机遇与挑战[J].声屏世界,2023(21):5-7.
2李雄文.数学概念教学的引入实例[J].中华活页文选（高中版）,2024(2):65-67.
3柴嘉欣,吉一帆,李雨情,宗鹤宸,宗雪晴,王静伟,常美玲,于宏伟.乙纶分子结构及热变性三级长波近红外-中红外光谱研究[J].纺织科学与工程学报,2024,41(1):58-67. 被引量：7
4程福.四元数在工业机器人编程操作中的应用[J].智能制造,2023(6):26-30.
5单彬,丁昕苗,王铭淏,郭文.多视图专家组区域建议预测的视觉跟踪[J].计算机工程与设计,2024,45(2):459-466. 被引量：1
6姜虹,马姣姣,姚红革,程嗣怡,陈游,喻钧.融合时空上下文信息的强化学习小目标快速搜索[J].电子学报,2023,51(11):3176-3186.
7于磊,田海川,张博,张纯,董玉雄,马林杰.基于小波降噪的深基坑地表沉降预测研究[J].山西建筑,2024,50(5):66-70. 被引量：2
8徐浩宸,刘满华.基于多层次自注意力网络的人脸特征点检测[J].计算机工程,2024,50(2):239-246. 被引量：1

计算机工程与应用

2024年第4期

浏览历史

内容加载中请稍等...

结合数据增强与特征融合的跨模态行人重识别

参考文献1

二级参考文献3

共引文献6

相关作者

相关机构

相关主题

浏览历史