为了更好地应对多目标跟踪联合检测算法面对的场景遮挡问题,通过结合注意力机制,提出基于Transformer的运动预测和数据关联(Transformer-based motion prediction and data association,TrMPDA)联合检测跟踪方法。首先,考虑到置信度检...为了更好地应对多目标跟踪联合检测算法面对的场景遮挡问题,通过结合注意力机制,提出基于Transformer的运动预测和数据关联(Transformer-based motion prediction and data association,TrMPDA)联合检测跟踪方法。首先,考虑到置信度检测框的质量以及深度特征的视觉表示能力对遮挡场景下跟踪效果的影响,重新设计TrMPDA骨干网络中的ResNet卷积模块,利用相邻像素和长距离像素间丰富的上下文关系指导动态注意矩阵的学习,增强深度特征的视觉表示能力,并通过边界框的宽和高估计边界框位置,提高置信度检测框的质量。其次,在本文方法中保留所有的检测框,根据阈值大小划分高置信度检测框和低置信度检测框,分别执行数据关联匹配,以此来平衡由于遮挡导致的检测框低置信度。实验结果表明本文提出的TrMPDA方法与典型的Sort、JDE、Fairmot等多目标跟踪算法相比具有更好的跟踪效果,能够应对多目标跟踪中目标遮挡的问题。展开更多
文摘为了更好地应对多目标跟踪联合检测算法面对的场景遮挡问题,通过结合注意力机制,提出基于Transformer的运动预测和数据关联(Transformer-based motion prediction and data association,TrMPDA)联合检测跟踪方法。首先,考虑到置信度检测框的质量以及深度特征的视觉表示能力对遮挡场景下跟踪效果的影响,重新设计TrMPDA骨干网络中的ResNet卷积模块,利用相邻像素和长距离像素间丰富的上下文关系指导动态注意矩阵的学习,增强深度特征的视觉表示能力,并通过边界框的宽和高估计边界框位置,提高置信度检测框的质量。其次,在本文方法中保留所有的检测框,根据阈值大小划分高置信度检测框和低置信度检测框,分别执行数据关联匹配,以此来平衡由于遮挡导致的检测框低置信度。实验结果表明本文提出的TrMPDA方法与典型的Sort、JDE、Fairmot等多目标跟踪算法相比具有更好的跟踪效果,能够应对多目标跟踪中目标遮挡的问题。