结合Graph-FPN与稳健优化的开放世界目标检测被引量：1

Open World Object Detection Combining Graph-FPN and Robust Optimization

下载PDF

导出

摘要开放世界目标检测(OWOD)要求检测图像中所有已知和未知的目标类别,同时模型必须逐步学习新的类别以自适应更新知识。针对ORE方法存在的未知目标召回率低以及增量学习的灾难性遗忘等问题,提出一种基于图特征金字塔的稳健优化开放世界目标检测方法(GARO-ORE)。首先,利用Graph-FPN中的超像素图像结构以及上下文层和层次层的分层设计,获取丰富的语义信息并帮助模型准确定位未知目标;之后,利用稳健优化方法对不确定性综合考量,提出了基于平坦极小值的基类学习策略,极大限度地保证模型在学习新类别的同时避免遗忘先前学习到的类别知识;最后,采用基于知识迁移的新增类别权值初始化方法提高模型对新类别的适应性。在OWOD数据集上的实验结果表明,GARO-ORE在未知类别召回率上取得较优的检测结果,在10+10、15+5、19+1三种增量目标检测(iOD)任务中,其mAP指标分别提升了1.38、1.42和1.44个百分点。可以看出,GARO-ORE能够较好地提高未知目标检测的召回率,并且在有效缓解旧任务灾难性遗忘问题的同时促进后续任务的学习。 Open world object detection(OWOD)requires detecting all known and unknown object categories in the image,and the model must gradually learn new categories to adaptively update knowledge.Aiming at the problems of low recall rate of unknown objects and catastrophic forgetting of incremental learning in ORE(open world object detection)method,this paper proposes adjustable robust optimization of ORE based on graph feature pyramid(GARO-ORE).Firstly,using the superpixel image structure in Graph-FPN and the hierarchical design of context layer and hierarchical layer,rich semantic information can be obtained and the model can accurately locate unknown object.Then,using the robust optimization method to comprehensively consider the uncertainty,a base class learning strategy based on flat minimum is proposed,which greatly ensures that the model avoids forgetting the previously learnt category knowledge while learning new categories.Finally,the classification weights initialization method based on knowledge transfer is used to improve the adaptability of the model to new classes.Experimental results on the OWOD dataset show that GARO-ORE achieves better detection results on the recall rate of unknown categories.In the three types of incremental object detection tasks of 10+10,15+5,and 19+1,the mAP is increased by 1.38,1.42 and 1.44 percentage points,respectively.It can be seen that GARO-ORE can improve the recall rate of unknown object detection,and promote the learning of subsequent tasks while effectively alleviating the catastrophic forgetting problem of old tasks.

作者谢斌红张鹏举张睿 XIE Binhong;ZHANG Pengju+;ZHANG Rui(College of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024,China)

机构地区太原科技大学计算机科学与技术学院

出处《计算机科学与探索》 CSCD 北大核心 2023年第12期2954-2966,共13页 Journal of Frontiers of Computer Science and Technology

基金山西省重点研发计划项目(201803D121048,201803D121055) 山西省基础研究计划项目(面上)(2021030212321) 吕梁市引进高层次科技人才重点研发项目(2022RC08)。

关键词开放世界目标检测(OWOD) 图特征金字塔网络平坦极小值知识迁移 open world object detection(OWOD) graph feature pyramid network flat minimum knowledge transfer

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1蒋弘毅,王永娟,康锦煜.目标检测模型及其优化方法综述[J].自动化学报,2021,47(6):1232-1255. 被引量：32
2李青援,邓赵红,罗晓清,顾鑫,王士同.注意力与跨尺度融合的SSD目标检测算法[J].计算机科学与探索,2022,16(11):2575-2586. 被引量：7
3高菲,杨柳,李晖.开放集识别研究综述[J].南京大学学报（自然科学版）,2022,58(1):115-134. 被引量：8
4刘冰瑶,刘进锋.增量学习研究综述[J].现代计算机,2022,28(13):72-75. 被引量：5

二级参考文献2

1刘晓龙,王士同.面向开放集图像分类的模糊域自适应方法[J].计算机科学与探索,2021,15(3):515-523. 被引量：2
2刘晓龙,王士同.渐进式分离的开放集模糊域自适应算法[J].计算机应用,2021,41(11):3127-3131. 被引量：1

共引文献48

1张学军,黄爽,靳伟,鄢金山,史增录,周鑫城,张朝书.基于改进Faster R-CNN的农田残膜识别方法[J].湖南大学学报（自然科学版）,2021,48(8):161-168. 被引量：9
2刘凯旋,黄操军,李亚鹏,佟尚谕.一种基于级联R-CNN的水稻害虫检测算法[J].黑龙江八一农垦大学学报,2021,33(5):106-111. 被引量：7
3王新,李喆,张宏立.一种迭代聚合的高分辨率网络Anchor-free目标检测方法[J].北京航空航天大学学报,2021,47(12):2533-2541. 被引量：3
4包俊,刘宏哲,褚文博.环视鱼眼图像处理深度学习研究进展[J].中国图象图形学报,2021,26(12):2778-2799. 被引量：1
5文载道,王佳蕊,王小旭,潘泉.解耦表征学习综述[J].自动化学报,2022,48(2):351-374. 被引量：8
6张雷,李冰倩.基于特征融合与注意力的织物缺陷检测研究[J].电脑与信息技术,2022,30(5):5-8. 被引量：1
7刘青茹,李刚,赵创,顾广华,赵耀.基于多重注意结构的图像密集描述生成方法研究[J].自动化学报,2022,48(10):2537-2548. 被引量：1
8苟军年,杜愫愫,刘力.基于改进掩膜区域卷积神经网络的输电线路绝缘子自爆检测[J].电工技术学报,2023,38(1):47-59. 被引量：16
9郑晗,储珺.目标检测中的特征融合方法[J].南昌航空大学学报（自然科学版）,2022,36(4):59-67. 被引量：2
10张帆,葛世荣.矿山数字孪生构建方法与演化机理[J].煤炭学报,2023,48(1):510-522. 被引量：20

同被引文献2

1孙旭豪,沈阳,魏秀参,安鹏.结合环状原型空间优化的开放集目标检测[J].中国图象图形学报,2023,28(9):2719-2732. 被引量：1
2徐鑫,方凯.基于改进YOLOv5的小目标交通标志检测算法[J].湖北汽车工业学院学报,2023,37(4):17-21. 被引量：1

引证文献1

1祝岚,翟亚红,徐龙艳,王杰,赵逸凡,叶子恒.多尺度的开放词汇目标检测[J].湖北汽车工业学院学报,2024,38(3):77-80.

1梁亚丽,杨涛,罗天娥.Caprini评估量表对经外周中心静脉置管导管相关性血栓预测能力的系统评价[J].中国血管外科杂志（电子版）,2023,15(2):161-164.
2速读[J].世界环境,2022(1):10-11.
3郑毓真,魏宇梅,李妍,李华芳.达营方药联合抗精神病药治疗精神分裂症和周期性精神病的系统评价[J].精神医学杂志,2023,36(1):11-16.
4田霖,李华,李林轩,白传澳.基于特征解耦的开放世界目标检测[J].重庆理工大学学报（自然科学）,2023,37(10):166-173.
5刘杰.基于模糊数学的治理成本法计算河北省排污权交易基准价格探讨[J].中国科技期刊数据库工业A,2023(7):76-79.
6Dibyendu Adhikari,Aabid Hussain Mir,Krishna Upadhaya,Viheno Iralu,Dilip Kumar Roy.Abundance and habitat-suitability relationship deteriorate in fragmented forest landscapes:a case of Adinandra griffithii Dyer,a threatened endemic tree from Meghalaya in northeast India[J].Ecological Processes,2018,7(1):23-31.
7刘少南,郭新峰,吴大嵘,ZHANG Anthony Lin,XUE Charlie Changli,温泽淮.中医干预类临床证据分级系统构建思路探讨[J].中医杂志,2023,64(18):1885-1889. 被引量：8
8康智.基于U-Net的雷达脉冲信号一体化检测、分选和识别[J].电子信息对抗技术,2023,38(6):45-52.
9蒋佳维(编译).多重耐药革兰阴性菌和耐万古霉素肠球菌携带者的感染发生率——一项系统评价和Meta回归分析[J].中华危重病急救医学,2023,35(7):756-756.
10赵欢,黄宇君,邢浩楠.基于自适应稀疏多项式混沌的流场/声爆多源不确定量化技术研究[J].力学学报,2023,55(9):2027-2042. 被引量：2

计算机科学与探索

2023年第12期

浏览历史

内容加载中请稍等...

结合Graph-FPN与稳健优化的开放世界目标检测被引量：1

参考文献4

二级参考文献2

共引文献48

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合Graph-FPN与稳健优化的开放世界目标检测 被引量：1

参考文献4

二级参考文献2

共引文献48

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

结合Graph-FPN与稳健优化的开放世界目标检测被引量：1