针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transfor...针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transformer的轻量化行人重识别(Lightweight Transformer-based Person Re-Identification,LTReID)算法,利用多头多注意力机制从全局角度提取人体不同部分特征,使用Circle损失和边界样本挖掘损失,以提高图像特征提取和细粒度图像检索性能,并利用快速掩码搜索剪枝算法对Transformer模型进行训练后轻量化,以提高模型的无人机平台部署能力。更进一步,提出一种可学习的面向无人机场景的空间信息嵌入,在训练过程中通过学习获得优化的非视觉信息,以提取无人机多视角下行人的不变特征,提升行人特征识别的鲁棒性。最后,在实际的无人机行人重识别数据库中,讨论了在不同量级主干网和不同剪枝率情况下所提LTReID算法的行人重识别性能,并与多种行人重识别算法进行了性能对比,结果表明了所提算法的有效性和优越性。展开更多
目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(...目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(squeeze and concat,SPC)模块,获取不同通道数的特征图。利用双层路由感知注意力机制,提取不同尺度特征图之间的注意力权重,得到逐级通道注意力向量。对逐级通道注意力向量的权重进行重新校准。将重新标定的权重与相应的特征图进行加权,输出具有更丰富细化特征信息的多尺度特征图。所提模型在大规模公开数据集(Market-1501、DukeMTMC-reID、MSMT17)上进行实验,相较于基线模型Rank-1分别提高了3.2、4.4、15.4个百分点,mAP分别提高了5.5、8.3、16.2个百分点,与现有前沿算法相比,能够实现更好的局部和全局特征通道之间的信息交互,提升模型对图像特征的细节感知能力.展开更多
文摘针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transformer的轻量化行人重识别(Lightweight Transformer-based Person Re-Identification,LTReID)算法,利用多头多注意力机制从全局角度提取人体不同部分特征,使用Circle损失和边界样本挖掘损失,以提高图像特征提取和细粒度图像检索性能,并利用快速掩码搜索剪枝算法对Transformer模型进行训练后轻量化,以提高模型的无人机平台部署能力。更进一步,提出一种可学习的面向无人机场景的空间信息嵌入,在训练过程中通过学习获得优化的非视觉信息,以提取无人机多视角下行人的不变特征,提升行人特征识别的鲁棒性。最后,在实际的无人机行人重识别数据库中,讨论了在不同量级主干网和不同剪枝率情况下所提LTReID算法的行人重识别性能,并与多种行人重识别算法进行了性能对比,结果表明了所提算法的有效性和优越性。
文摘具有混合记忆的自步对比学习(Self-paced Contrastive Learning,SpCL)通过集群聚类生成不同级别的伪标签来训练网络,取得了较好的识别效果,然而该方法从源域和目标域中捕获的行人数据之间存在典型的分布差异,使得训练出的网络不能准确区别目标域和源域数据域特征。针对此问题,提出了双分支动态辅助对比学习(Dynamic Auxiliary Contrastive Learning,DACL)框架。该方法首先通过动态减小源域和目标域之间的局部最大平均差异(Local Maximum Mean Discrepancy,LMMD),以有效地学习目标域的域不变特征;其次,引入广义均值(Generalized Mean,GeM)池化策略,在特征提取后再进行特征聚合,使提出的网络能够自适应地聚合图像的重要特征;最后,在3个经典行人重识别数据集上进行了仿真实验,提出的DACL与性能次之的无监督域自适应行人重识别方法相比,mAP和rank-1在Market1501数据集上分别增加了6.0个百分点和2.2个百分点,在MSMT17数据集上分别增加了2.8个百分点和3.6个百分点,在Duke数据集上分别增加了1.7个百分点和2.1个百分点。
文摘目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(squeeze and concat,SPC)模块,获取不同通道数的特征图。利用双层路由感知注意力机制,提取不同尺度特征图之间的注意力权重,得到逐级通道注意力向量。对逐级通道注意力向量的权重进行重新校准。将重新标定的权重与相应的特征图进行加权,输出具有更丰富细化特征信息的多尺度特征图。所提模型在大规模公开数据集(Market-1501、DukeMTMC-reID、MSMT17)上进行实验,相较于基线模型Rank-1分别提高了3.2、4.4、15.4个百分点,mAP分别提高了5.5、8.3、16.2个百分点,与现有前沿算法相比,能够实现更好的局部和全局特征通道之间的信息交互,提升模型对图像特征的细节感知能力.