基于CNN和Transformer混合融合骨干的改进型DETR目标检测方法研究被引量：2

Research on improved DETR target detection method based on hybrid fusion backbone of CNN and Transformer

下载PDF

导出

摘要在目标检测感知任务中,基于Detection Transformer(DETR)的无锚框方法由于不需要复杂的非极大值抑制后处理操作从而受到了广泛的关注。针对DETR使用的残差网络(Residual Network, Res Net)骨干在全局信息提取能力上的不足,文章提出一种基于卷积神经网络(Convolutional Neural Network,CNN)和Transformer混合融合骨干的改进型DETR目标检测方法。模型骨干网络基于Swin Transformer改进,在层级结构上并联多个ConvNext块,完成对局部信息和全局信息特征的融合提取,图像特征与可学习的目标查询进行交叉注意力生成预测框。在COCO2017测试集结果证明,改进型DETR方法能够更有效地融合特征,在平均AP上较Res Net50骨干网络AP提升1.6%,在FPS上较Res Net50骨干网络提升10.7%。 Among target detection awareness tasks, anchored frameless methods based on Detection Transformer(DETR) have attracted wide attention because they do not require complex non-maximum suppression post-processing operations. According to the insufficient global information extraction capability of the Residual Network(ResNet)backbone used by DETR, An improved DETR object detection method based on the Convolutional Neural Network(CNN) and Transformer is proposed in this paper. Based on the improvement of Swin Transformer, the model backbone network connects multiple ConvNext blocks in hierarchical structure to complete the fusion extraction of local information and global information features, and the cross-attention of image features and learning target queries to generate prediction box. The results of the COCO2017 test set prove that the improved DETR method can fuse features more effectively, with an average AP increase of 3. 8% and FPS increase of 10. 7% compared to the ResNet50backbone network.

作者金祖亮 Jin Zuliang(Chongqing Jiaotong University,Chongqing 400074,China)

机构地区重庆交通大学

出处《无线互联科技》 2022年第23期109-112,共4页 Wireless Internet Technology

关键词目标检测混合融合 TRANSFORMER CNN object detection hybrid fusion transformer CNN

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1李柯泉,陈燕,刘佳晨,牟向伟.基于深度学习的目标检测算法综述[J].计算机工程,2022,48(7):1-12. 被引量：85
2梁鸿,李洋,邵明文,李传秀,张兆雷.基于残差网络和改进特征金字塔的油田作业现场目标检测算法[J].科学技术与工程,2020,20(11):4442-4450. 被引量：5

二级参考文献9

1黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
2汤伟,刘思洋,高涵,陶倩.基于视觉的水面垃圾清理机器人目标检测算法[J].科学技术与工程,2019,19(3):136-141. 被引量：21
3石桂名,索继东.基于视觉注意机制的视频监控中海上舰船目标检测[J].科学技术与工程,2019,19(2):150-156. 被引量：4
4张泽苗,霍欢,赵逢禹.深层卷积神经网络的目标检测算法综述[J].小型微型计算机系统,2019,40(9):1825-1831. 被引量：61
5李祥兵,陈炼.基于改进Faster-RCNN的自然场景人脸检测[J].计算机工程,2021,47(1):210-216. 被引量：16
6徐龙壮,彭力,朱凤增.多任务金字塔重叠匹配的行人重识别方法[J].计算机工程,2021,47(1):239-245. 被引量：6
7王健宗,孔令炜,黄章成,肖京.图神经网络综述[J].计算机工程,2021,47(4):1-12. 被引量：29
8刘华玲,马俊,张国祥.基于深度学习的内容推荐算法研究综述[J].计算机工程,2021,47(7):1-12. 被引量：38
9姜竣,翟东海.基于空洞卷积与特征增强的单阶段目标检测算法[J].计算机工程,2021,47(7):232-238. 被引量：7

共引文献88

1邹剑,陈征,刘长龙,张乐,张玺亮,蓝飞,王威.基于YOLOv5s-CBAM的海上平台注水流程现场漏液智能检测[J].系统仿真技术,2024,20(2):175-179.
2姚文席,张志强,黄蔚.摆线针轮行星减速机的回程误差分析[J].机械设计与研究,2000,16(1):30-32. 被引量：6
3岳有军,孙碧玉,王红君,赵辉.基于级联卷积神经网络的番茄果实目标检测[J].科学技术与工程,2021,21(6):2387-2391. 被引量：20
4杨洁亮,彭召旺,郭奕丰.边缘计算在智慧城市社区级感知层的应用[J].电子技术与软件工程,2021(23):58-61.
5朱联祥,徐莉娟.基于改进YOLOv3-tiny的车辆目标检测[J].信息技术与信息化,2022(3):9-12. 被引量：2
6臧国强,刘晓莉,徐颖菲,陈雨露,李文波.深度学习在电力设备缺陷识别中的应用进展[J].电气技术,2022,23(6):1-7. 被引量：14
7李刚,齐铭伟,张飞扬,吴凡.基于RepVGG-YOLOv4的焦罐提升机状态检测[J].工业控制计算机,2022,35(6):43-45. 被引量：2
8朱福珍,王帅,巫红.改进的PP-YOLO网络遥感图像目标检测[J].高技术通讯,2022,32(5):528-534. 被引量：5
9刘辉宇,杨震卿,黄爱菊.基于深度学习的混凝土质量检测算法[J].建筑技术,2022,53(7):957-961. 被引量：2
10林健,张巍巍,张凯,杨尧.基于YOLOv5的红外目标检测算法[J].飞控与探测,2022,5(3):63-71. 被引量：6

同被引文献28

1张俊峰.胶带输送机上清除煤中杂物的方法[J].中州煤炭,2005(5):47-48. 被引量：5
2田文利.基于双重滤波与锐化的遥感图像增强算法[J].国外电子测量技术,2017,36(4):13-16. 被引量：15
3苏婕,于莲芝.基于MATLAB的图像处理空间域滤波研究[J].软件导刊,2017,16(8):132-134. 被引量：6
4王卫东,张康辉,吕子奇,薛峰,徐志强,刘峰,李佰云,杨永强.基于机器视觉的煤中杂物智能分选系统研究[J].选煤技术,2020,0(2):87-91. 被引量：15
5徐志强,吕子奇,王卫东,张康辉,吕海梅.煤矸智能分选的机器视觉识别方法与优化[J].煤炭学报,2020,45(6):2207-2216. 被引量：62
6王卫东,张康辉,吕子奇,谷诏闯,钱瀚文,张情意.基于深度学习的煤中异物机器视觉检测[J].矿业科学学报,2021,6(1):115-123. 被引量：17
7梁秀满,田童,刘文涛,牛福生.基于泡沫图像特征融合的煤泥浮选工况识别[J].计算机仿真,2021,38(4):385-389. 被引量：8
8代现法,张光伟,贾存瑞,葛家君,夏亮亮,翟德平,郭利健.高效脱泥设备在阳城煤矿选煤厂的应用[J].煤炭加工与综合利用,2021(10):31-33. 被引量：3
9赵银银.选煤厂末煤脱泥工艺改造优化与实践[J].山西化工,2022,42(1):156-157. 被引量：1
10申智,徐丽,符祥远.基于改进YOLO v4光线模糊场景下交通标志检测[J].计算机与现代化,2022(7):27-32. 被引量：2

引证文献2

1师亚文,崔耀,刁长隆.开放场景下筛上杂物目标检测算法研究[J].煤炭工程,2023,55(S01):225-230.
2Ashikur Rahman Mohammad,李军.基于CNN技术和DETR的智能汽车自动驾驶道路智能识别的研究[J].长江信息通信,2023,36(11):32-34.

1Detrás de las cocinas compartidas[J].今日中国（西文版）,2021(2):19-21.
2La historia detrás de las imágenes[J].今日中国（西文版）,2014(5):24-27.
3La lógica detrás de la lucha contra la pobreza[J].今日中国（西文版）,2018(11):45-47.
4Detrás de una botella de vino español[J].今日中国（西文版）,2021(8):48-50.
5Detrás de las disputas en el Mar Meridional de China[J].今日中国（西文版）,2014(4):26-28.
6El cerebro detrás de los trenes de alta velocidad[J].今日中国（西文版）,2016(1):54-56.
7Historias detrás de una máscara[J].今日中国（西文版）,2021(4):58-60.
8汪岑晶,刘嘉怡,彭宏成,马帅.基于注意力机制的SE-Resnet50森林火灾检测算法模型设计[J].移动信息,2022(11):187-189.
9李泰国,张英志,张天策,陈小强.基于改进YOLOv5s算法的列车驾驶员手势识别[J].铁道学报,2023,45(1):75-83. 被引量：8
10白俊卿,张文静.基于YOLOv4优化的轻量级无人机障碍物检测方法[J].电子测量技术,2022,45(22):87-91. 被引量：3

无线互联科技

2022年第23期

浏览历史

内容加载中请稍等...

基于CNN和Transformer混合融合骨干的改进型DETR目标检测方法研究被引量：2

参考文献2

二级参考文献9

共引文献88

同被引文献28

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CNN和Transformer混合融合骨干的改进型DETR目标检测方法研究 被引量：2

参考文献2

二级参考文献9

共引文献88

同被引文献28

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CNN和Transformer混合融合骨干的改进型DETR目标检测方法研究被引量：2