针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transfor...针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transformer的轻量化行人重识别(Lightweight Transformer-based Person Re-Identification,LTReID)算法,利用多头多注意力机制从全局角度提取人体不同部分特征,使用Circle损失和边界样本挖掘损失,以提高图像特征提取和细粒度图像检索性能,并利用快速掩码搜索剪枝算法对Transformer模型进行训练后轻量化,以提高模型的无人机平台部署能力。更进一步,提出一种可学习的面向无人机场景的空间信息嵌入,在训练过程中通过学习获得优化的非视觉信息,以提取无人机多视角下行人的不变特征,提升行人特征识别的鲁棒性。最后,在实际的无人机行人重识别数据库中,讨论了在不同量级主干网和不同剪枝率情况下所提LTReID算法的行人重识别性能,并与多种行人重识别算法进行了性能对比,结果表明了所提算法的有效性和优越性。展开更多
目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(...目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(squeeze and concat,SPC)模块,获取不同通道数的特征图。利用双层路由感知注意力机制,提取不同尺度特征图之间的注意力权重,得到逐级通道注意力向量。对逐级通道注意力向量的权重进行重新校准。将重新标定的权重与相应的特征图进行加权,输出具有更丰富细化特征信息的多尺度特征图。所提模型在大规模公开数据集(Market-1501、DukeMTMC-reID、MSMT17)上进行实验,相较于基线模型Rank-1分别提高了3.2、4.4、15.4个百分点,mAP分别提高了5.5、8.3、16.2个百分点,与现有前沿算法相比,能够实现更好的局部和全局特征通道之间的信息交互,提升模型对图像特征的细节感知能力.展开更多
针对当前无监督行人重识别方法因受到硬件差异、光照变化等客观因素的影响,导致同一行人图像出现较大反差,随之易带来样本错误伪标签生成的问题,使得现有无监督行人重识别方法还有待进一步提升的空间。为了解决此问题,提出了一种基于二...针对当前无监督行人重识别方法因受到硬件差异、光照变化等客观因素的影响,导致同一行人图像出现较大反差,随之易带来样本错误伪标签生成的问题,使得现有无监督行人重识别方法还有待进一步提升的空间。为了解决此问题,提出了一种基于二次重聚类的无监督行人重识别(unsupervised person re-identification based on quadratic clustering)方法。该方法主要包括全局二次聚类的无监督学习模块和基于聚类结果的有监督学习模块。具体来说,前者基于全局二次聚类分别对相机ID和行人身份ID进行无监督分析,解决了同一行人在不同摄像机视角下的统一成像风格问题;后者则采用有监督学习方式改进了内存字典的初始化与更新方式,解决了模型在训练中偏移的问题。通过此双模块的协同训练以共同抑制跨摄像头间采集的图像所产生错误伪标签的问题。所提出的算法分别在Market-1501、DukeMTMC-ReID、MSMT17、Person和VeRi-776数据集上进行实验,取得了mAP=81.2%和rank-1=91.2%、mAP=68.4%和rank-1=78.7%、mAP=31.1%和rank-1=60.4%、mAP=88.3%和rank-1=93.6%的性能,对比当前最先进的方法,分别提高了2.4、1.8、6.0、2.5和4.3个百分点的rank-1准确率。展开更多
文摘针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transformer的轻量化行人重识别(Lightweight Transformer-based Person Re-Identification,LTReID)算法,利用多头多注意力机制从全局角度提取人体不同部分特征,使用Circle损失和边界样本挖掘损失,以提高图像特征提取和细粒度图像检索性能,并利用快速掩码搜索剪枝算法对Transformer模型进行训练后轻量化,以提高模型的无人机平台部署能力。更进一步,提出一种可学习的面向无人机场景的空间信息嵌入,在训练过程中通过学习获得优化的非视觉信息,以提取无人机多视角下行人的不变特征,提升行人特征识别的鲁棒性。最后,在实际的无人机行人重识别数据库中,讨论了在不同量级主干网和不同剪枝率情况下所提LTReID算法的行人重识别性能,并与多种行人重识别算法进行了性能对比,结果表明了所提算法的有效性和优越性。
文摘具有混合记忆的自步对比学习(Self-paced Contrastive Learning,SpCL)通过集群聚类生成不同级别的伪标签来训练网络,取得了较好的识别效果,然而该方法从源域和目标域中捕获的行人数据之间存在典型的分布差异,使得训练出的网络不能准确区别目标域和源域数据域特征。针对此问题,提出了双分支动态辅助对比学习(Dynamic Auxiliary Contrastive Learning,DACL)框架。该方法首先通过动态减小源域和目标域之间的局部最大平均差异(Local Maximum Mean Discrepancy,LMMD),以有效地学习目标域的域不变特征;其次,引入广义均值(Generalized Mean,GeM)池化策略,在特征提取后再进行特征聚合,使提出的网络能够自适应地聚合图像的重要特征;最后,在3个经典行人重识别数据集上进行了仿真实验,提出的DACL与性能次之的无监督域自适应行人重识别方法相比,mAP和rank-1在Market1501数据集上分别增加了6.0个百分点和2.2个百分点,在MSMT17数据集上分别增加了2.8个百分点和3.6个百分点,在Duke数据集上分别增加了1.7个百分点和2.1个百分点。
文摘目前无监督的泛化行人重识别算法在某些需要背景信息辅助判断的情况下,可能会忽视图像的局部区域对细粒度特征的关注,导致背景信息被过滤掉,从而降低识别精度。针对上述问题,提出了一种基于稀疏注意力的动态查询感知算法。通过挤压拼接(squeeze and concat,SPC)模块,获取不同通道数的特征图。利用双层路由感知注意力机制,提取不同尺度特征图之间的注意力权重,得到逐级通道注意力向量。对逐级通道注意力向量的权重进行重新校准。将重新标定的权重与相应的特征图进行加权,输出具有更丰富细化特征信息的多尺度特征图。所提模型在大规模公开数据集(Market-1501、DukeMTMC-reID、MSMT17)上进行实验,相较于基线模型Rank-1分别提高了3.2、4.4、15.4个百分点,mAP分别提高了5.5、8.3、16.2个百分点,与现有前沿算法相比,能够实现更好的局部和全局特征通道之间的信息交互,提升模型对图像特征的细节感知能力.
文摘针对当前无监督行人重识别方法因受到硬件差异、光照变化等客观因素的影响,导致同一行人图像出现较大反差,随之易带来样本错误伪标签生成的问题,使得现有无监督行人重识别方法还有待进一步提升的空间。为了解决此问题,提出了一种基于二次重聚类的无监督行人重识别(unsupervised person re-identification based on quadratic clustering)方法。该方法主要包括全局二次聚类的无监督学习模块和基于聚类结果的有监督学习模块。具体来说,前者基于全局二次聚类分别对相机ID和行人身份ID进行无监督分析,解决了同一行人在不同摄像机视角下的统一成像风格问题;后者则采用有监督学习方式改进了内存字典的初始化与更新方式,解决了模型在训练中偏移的问题。通过此双模块的协同训练以共同抑制跨摄像头间采集的图像所产生错误伪标签的问题。所提出的算法分别在Market-1501、DukeMTMC-ReID、MSMT17、Person和VeRi-776数据集上进行实验,取得了mAP=81.2%和rank-1=91.2%、mAP=68.4%和rank-1=78.7%、mAP=31.1%和rank-1=60.4%、mAP=88.3%和rank-1=93.6%的性能,对比当前最先进的方法,分别提高了2.4、1.8、6.0、2.5和4.3个百分点的rank-1准确率。