-
题名融合多尺度和注意力机制的小样本目标检测
- 1
-
-
作者
李鸿天
史鑫昊
潘卫国
徐成
徐冰心
袁家政
-
机构
北京市信息服务工程重点实验室(北京联合大学)
北京开放大学科技学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第5期1437-1444,共8页
-
基金
北京市自然科学基金资助项目(4232026)
国家自然科学基金资助项目(62171042,62272049,61932012,61871039,62102033,62006020)
+3 种基金
北京市重点科技项目(KZ202211417048)
北京市属高等学校高水平科研创新团队项目(BPHR20220120)
北京市朝阳区协同创新中心资助项目(CYX2203)
北京联合大学科研项目(ZK10202202,BPHR2020DZ02,ZK40202101,ZK120202104)。
-
文摘
现有基于微调的二阶段小样本目标检测方法对新类特征不敏感,易将新类别误判成与它相似度高的基类,影响模型的检测性能。针对上述问题,提出一种融合多尺度和注意力机制的小样本目标检测(MA-FSOD)算法。首先在骨干网络使用分组卷积和大卷积核提取更具类别区分性的特征,并加入卷积注意力模块(CBAM)实现特征的自适应增强;再通过改进的金字塔网络实现多尺度的特征融合,使候选框生成网络(RPN)可以准确找到感兴趣区域(RoI),从多个尺度向分类头提供更丰富的高质量正样本;最后在微调阶段采用余弦分类头进行分类,降低类内方差。在PASCAL-VOC 2007/2012数据集上与基于候选框编码对比损失的小样本目标检测(FSCE)算法相比,MA-FSOD算法对新类的AP_(50)提升了5.6个百分点;在更具挑战性的MSCOCO数据集中,与Meta-Faster-RCNN相比,10-shot和30-shot对应的AP则分别提升了0.1个百分点和1.6个百分点。实验结果表明,相较于一些主流的小样本目标检测算法,MA-FSOD算法能更有效地缓解误分类问题,实现更高精度的小样本目标检测。
-
关键词
迁移学习
小样本目标检测
注意力机制
多尺度特征融合
余弦相似度
-
Keywords
transfer learning
few-shot object detection
attention mechanism
multi-scale feature fusion
cosine similarity
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-