开放世界目标检测是一个十分具有挑战的任务,主要在于两个方面:一是要求检测器能正确识别未知的目标并做出预测;二是模型需要通过增量学习以纳入新的知识。传统的目标检测算法在完整的数据集上进行训练,输出数据集中所标注类别的预测,...开放世界目标检测是一个十分具有挑战的任务,主要在于两个方面:一是要求检测器能正确识别未知的目标并做出预测;二是模型需要通过增量学习以纳入新的知识。传统的目标检测算法在完整的数据集上进行训练,输出数据集中所标注类别的预测,但实际场景中往往会遇到被标注类别之外的目标需要识别和检测,因此开放世界的概念被提出。随着Transformer在目标检测领域的应用不断深入,研究者提出了新的方法和模型。本文是对开放世界目标检测模型OWDETR(Open World Detection Transformer)的轻量化改进。本文设计了一种基于RPN的目标查询提议网络,结合泛化物体置信度选择RoI并初始化目标查询向量,使得模型在编解码器数量下降、训练时间大大减少的同时,对已知目标获得了更好的检测精度(平均每个精度指标比OW-DETR高1.29%,最高4.4%)。结合消融实验,本文证明了方法的有效性和尚有缺陷的地方,并指出将来工作的改进方向。展开更多
文摘开放世界目标检测是一个十分具有挑战的任务,主要在于两个方面:一是要求检测器能正确识别未知的目标并做出预测;二是模型需要通过增量学习以纳入新的知识。传统的目标检测算法在完整的数据集上进行训练,输出数据集中所标注类别的预测,但实际场景中往往会遇到被标注类别之外的目标需要识别和检测,因此开放世界的概念被提出。随着Transformer在目标检测领域的应用不断深入,研究者提出了新的方法和模型。本文是对开放世界目标检测模型OWDETR(Open World Detection Transformer)的轻量化改进。本文设计了一种基于RPN的目标查询提议网络,结合泛化物体置信度选择RoI并初始化目标查询向量,使得模型在编解码器数量下降、训练时间大大减少的同时,对已知目标获得了更好的检测精度(平均每个精度指标比OW-DETR高1.29%,最高4.4%)。结合消融实验,本文证明了方法的有效性和尚有缺陷的地方,并指出将来工作的改进方向。