基于可变形卷积的改进YOLO目标检测算法被引量：15

Improved YOLO Object Detection Algorithm Based on Deformable Convolution

下载PDF

导出

摘要针对YOLO目标检测算法存在边界框定位不准确及对小目标检测精度低的问题,提出一种改进的YOLO目标检测算法dcn-YOLO。使用k-means++算法聚类出更符合数据集尺寸的锚盒,以降低初始点对聚类结果的影响并加快网络训练收敛速度。构建残差可变形卷积模块res-dcn,分别采用将其嵌入YOLO第一特征提取头模块中和替换3个YOLO特征提取头模块的方式,构建两种改进的dcn-YOLO算法,使网络可以自适应地学习特征点的感受野,从而对不同尺寸和形状的目标提取更有效的特征,提高检测精度。在VOC数据集上的实验结果表明,该算法能有效提高目标检测精度,mAP达到82.6%,相比YOLO、SSD、Faster R-CNN,分别高出了2.1、5.2、9.4个百分点。 The YOLO algorithm for object detection is limited by the inaccurate positioning of the boundary box and the low detection accuracy for small objects.To address the problem,an improved YOLO algorithm,dcn-YOLO,is proposed based on deformable convolution for object detection.The algorithm employs the K-means++to cluster anchor boxes that are more in line with the size of data set,so as to reduce the impact of initial points on clustering results and speed up the convergence of network training.Then,a residual deformable convolution module,res-dcn,is constructed.Two improved dcn-YOLO algorithms are derived by embedding res-dcn in the first YOLO feature extraction head module or replacing three YOLO feature extraction head modules with res-dcn,so the network can adaptively learn the receptive field of feature points and extract more effective features for objects of different sizes and shapes,increasing the detection accuracy.Experimental results on VOC data sets show that the propose algorithm can effectively improve the object detection accuracy.Its mAP reaches 82.6%,which is 2.1 percentage points higher than that of YOLO,5.2 percentage points higher than that of SSD and 9.4 percentage points higher than that of Faster R-CNN.

作者黄凤琪陈明冯国富 HUANG Fengqi;CHEN Ming;FENG Guofu(Institute of Information Technology,Shanghai Ocean University,Shanghai 201306,China)

机构地区上海海洋大学信息学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第10期269-275,282,共8页 Computer Engineering

基金国家重点研发计划(2018YFD0701003) 上海市科技创新行动计划(6391902902)。

关键词 YOLO算法目标检测感受野可变形卷积 k-means++算法 YOLO algorithm object detection receptive field deformable convolution k-means++algorithm

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1李军伟,周小龙,产思贤,陈胜勇.基于自适应卷积神经网络特征选择的视频目标跟踪方法[J].计算机辅助设计与图形学学报,2018,30(2):273-281. 被引量：21
2桑军,郭沛,项志立,罗红玲,陈欣.Faster-RCNN的车型识别分析[J].重庆大学学报（自然科学版）,2017,40(7):32-36. 被引量：46
3芮挺,费建超,周遊,方虎生,朱经纬.基于深度卷积神经网络的行人检测[J].计算机工程与应用,2016,52(13):162-166. 被引量：73
4谢林江,季桂树,彭清,罗恩韬.改进的卷积神经网络在行人检测中的应用[J].计算机科学与探索,2018,12(5):708-718. 被引量：46
5徐诚极,王晓峰,杨亚东.Attention-YOLO:引入注意力机制的YOLO检测算法[J].计算机工程与应用,2019,55(6):13-23. 被引量：69
6管皓,薛向阳,安志勇.一种利用在线卷积网络的视频目标跟踪方法[J].小型微型计算机系统,2017,38(4):872-875. 被引量：1

二级参考文献29

1侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006,32(4):603-617. 被引量：255
2Dalal N,Triggs B.Histograms of oriented gradients forhuman detection[C]//Proceedings of the 2005 IEEE InternationalConference on Computer Vision and Pattern Recognition.Washington,DC:IEEE Computer Society,2005,1:886-893.
3Wu B,Nevatia R.Optimizing discrimination-efficiencytradeoff in integrating heterogeneous local features forobject detection[C]//Proceedings of the 2008 IEEE InternationalConference on Computer Vision and PatternRecognition.Washington,DC:IEEE Computer Society,2008:1-8.
4Viola P,Jones M.Rapid object detection using a boostedcascade of simple features[C]//Proceedings of CVPR2001,Kauai,HI,USA,2001:511-518.
5Serre T,Wolf L,Bileschi S,et al.Object recognition withcortex-like mechanisms[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,2007,29(3):411-428.
6Ye Q,Liang J,Jiao J.Pedestrian detection in video imagesvia error correcting output code classification of manifoldsubclasses[J].IEEE Transactions on Intelligent TransportationSystems,2012,13(1):193-202.
7Munder S,Gavrila D M.An experimental study on pedestrianclassification[J].IEEE Transactions on Pattern Analysisand Machine Computer Vision,2006,28(11):1863-1868.
8Wu B,Nevatia R.Cluster boosted tree classifier for multiview,multi-pose object detection[C]//Proceedings of the11th IEEE International Conference on Computer Vision.Washington,DC:IEEE Computer Society,2007:1-8.
9Bengio Y.Learning deep architectures for AI[J].Foundationsand Trends in Machine Learning,2009,2(1):1-71.
10Dahl G E,Yu D,Deng L,et al.Context-dependent pretraineddeep neural networks for large-vocabulary speechrecognition[J].IEEE Trans on Audio Speech and LanguageProcessing,2012,20(1):30-42.

共引文献239

1陈立潮,王彦苏,曹建芳.基于Dense-YOLOv3的车型检测模型[J].计算机系统应用,2020(10):158-166. 被引量：3
2Li Chen,Nan Ma,Patrick Wang,Jiahong Li,Pengfei Wang,Guilin Pang,Xiaojun Shi.Survey of Pedestrian Action Recognition Techniques for Autonomous Driving[J].Tsinghua Science and Technology,2020,25(4):458-470. 被引量：5
3喻晗.单张图像重建人脸3D模型的卷积神经网络系统研究[J].计算机产品与流通,2019,0(12):119-119.
4侯帅鹏,石英,华逸伦,苏涛.基于改进SSD的行人检测模型[J].武汉理工大学学报,2019,41(7):95-102. 被引量：1
5夏敏,赵旭东,费琦琪,孙鹏,杨琳琳.基于计算机视觉技术的天麻分选装置设计[J].农机化研究,2020,42(9):104-108.
6朱江,李华健.基于YOLOv3的抓取检测网络[J].信息化研究,2022,48(1):19-24. 被引量：1
7徐世武,曾珏,张诗慧,李长征,李亭谕.一种深度卷积神经网络土地利用场景照片的分类方法[J].测绘通报,2020(2):24-28. 被引量：2
8余泳,齐运书,杨浩恩,郭磊.基于动量的高速公路视频检测算法[J].中国科技纵横,2019,0(14):17-18.
9王九清,邢素霞,王孝义,曹宇.基于卷积神经网络与高光谱的鸡肉品质分类检测[J].肉类研究,2018,32(12):36-41. 被引量：6
10尹霄丽,郭翊麟,崔小舟,常欢,陈小政.基于卷积神经网络的多OAM态识别方法[J].北京邮电大学学报,2019,42(1):47-52. 被引量：6

同被引文献145

1宋志娜,眭海刚,李永成.高分辨率可见光遥感图像舰船目标检测综述[J].武汉大学学报（信息科学版）,2021,46(11):1703-1715. 被引量：12
2王卓,王健,王枭雄,时佳,白晓平,赵泳嘉.基于改进YOLO v4的自然环境苹果轻量级检测方法[J].农业机械学报,2022,53(8):294-302. 被引量：36
3杨寿勇,张海阳,李成,李静,张学治.基于卷积神经网络模型的微藻种类识别[J].环境科学与技术,2020(S02):158-164. 被引量：5
4刘毅,于畅洋,李国燕,潘玉恒.UAST-RCNN:遮挡行人的目标检测算法[J].电子测量与仪器学报,2022,36(12):168-175. 被引量：10
5卢瑜,郝兴文,王永俊.Moravec和Harris角点检测方法比较研究[J].计算机技术与发展,2011,21(6):95-97. 被引量：32
6谢文亮,朱丹,佟新鑫.一种基于视觉注意的小目标检测方法[J].计算机工程与应用,2013,49(12):125-128. 被引量：7
7刘江平.揭开无人海战的序幕中国“瞭望者”Ⅱ无人艇[J].坦克装甲车辆,2019,0(2):26-30. 被引量：4
8袁明新,张丽民,朱友帅,姜烽,申燚.基于深度学习方法的海上舰船目标检测[J].舰船科学技术,2019,41(1):111-115. 被引量：18
9景宏磊,聂菁.基于灰度共生矩阵的高效积分图像计算(英文)[J].吉林师范大学学报（自然科学版）,2014,35(4):136-138. 被引量：2
10蔡强,刘亚奇,曹健,毛典辉,牛群.图像目标类别检测综述[J].计算机科学与探索,2015,9(3):257-265. 被引量：13

引证文献15

1张猛,尹丽菊,周辉,邹国锋,秦怡鸣,李铭宇.基于SimAM-Ada YOLOv5的太阳能电池表面缺陷检测[J].电子测量技术,2023,46(22):17-25. 被引量：1
2李科岑,王晓强,林浩,李雷孝,杨艳艳,孟闯,高静.深度学习中的单阶段小目标检测方法综述[J].计算机科学与探索,2022,16(1):41-58. 被引量：57
3张坤,罗亚松,刘忠.基于YOLOv4的海上目标识别技术研究[J].兵器装备工程学报,2022,43(4):211-217. 被引量：2
4张宇廷,王宗彦,范浩东,王曦.基于深度学习的并联机器人定位检测技术研究[J].电子测量技术,2022,45(11):147-153. 被引量：4
5赵锞,贾可,李航,周录庆.轻量级可形变卷积神经网络DPCNs研究[J].信息记录材料,2022,23(12):183-185.
6王程,刘元盛,刘圣杰.基于改进YOLOv4的小目标行人检测算法[J].计算机工程,2023,49(2):296-302. 被引量：17
7游双,张著洪.基于通道注意力与空间金字塔的改进型YOLOv3及其应用[J].智能计算机与应用,2023,13(2):179-186.
8吴志高,陈明.基于改进YOLO v7的微藻轻量级检测方法[J].大连海洋大学学报,2023,38(1):129-139. 被引量：12
9郭瑞香.基于感兴趣区域池化的SAR图像目标检测算法[J].邵阳学院学报（自然科学版）,2023,20(2):29-36.
10刘卫光,刘东,王璐.可变形卷积网络研究综述[J].计算机科学与探索,2023,17(7):1549-1564. 被引量：5

二级引证文献111

1张楠楠,张晓,白铁成,尚鹏,王文瀚,李莉.基于CBAM-YOLO v7的自然环境下棉叶病虫害识别方法[J].农业机械学报,2023,54(S01):239-244. 被引量：5
2王伯涛,周福强,吴国新,王少红.基于改进YOLOv7的输电线路绝缘子识别检测研究[J].电子测量技术,2023,46(23):127-134. 被引量：1
3金鑫,洪彬,于东升,栾声扬.基于改进YOLOv5s的煤矿电力设备缺陷检测[J].电子测量技术,2023,46(19):148-155. 被引量：4
4郭秀明,诸叶平,李世娟,张杰,吕纯阳,刘升平.农业复杂环境下尺度自适应小目标识别算法——以蜜蜂为研究对象[J].智慧农业（中英文）,2022,4(1):140-149. 被引量：1
5张艳,张明路,吕晓玲,郭策,蒋志宏.深度学习小目标检测算法研究综述[J].计算机工程与应用,2022,58(15):1-17. 被引量：28
6牛润,曲毅,郑乐辉,魏建国.面向小目标检测的并行高分辨率网络设计[J].计算机工程与应用,2022,58(18):172-179.
7杨哲,卜子渝.面向小目标检测的机器视觉实验项目改进设计[J].实验技术与管理,2022,39(9):64-70. 被引量：2
8杨兴龙,蒋佳彤,韩嘉熠,颜新云.基于YOLOv5的高速公路目标检测算法的设计与实践[J].电脑知识与技术,2022,18(25):103-106.
9于方程,张小俊,张明路,赵天亮.基于改进CenterNet的自动驾驶小目标检测[J].电子测量技术,2022,45(15):115-122. 被引量：8
10左宁,马晓斌,陈智斌,田浩,韩艳.铁路货物装卸机械检修管理及其信息系统研究[J].铁道货运,2022,40(10):27-35. 被引量：4

1中国企业级SSD产业链图谱[J].中国科技信息,2021(20):8-9.
2赵伟娟,时晓华,赵静娟.中等强度有氧训练对慢性肾功能不全合并高血压老年患者动态血压水平及肾功能的影响[J].国际移植与血液净化杂志,2021,19(4):37-39. 被引量：1
3闫春宇.五四时期的思想启蒙与民族认同[J].文教资料,2021(19):50-52.
4刘玉岩.高中数学模块教学设计分析[J].数理化解题研究,2021(30):44-45. 被引量：1
5生态的风景风景的生态[J].城市住宅,2021,28(8):7-14.
6ZHAO Yuanyuan,GAO Shining,LIU Yang,GONG Xiaohui.Long Text Classification Algorithm Using a Hybrid Model of Bidirectional Encoder Representation from Transformers-Hierarchical Attention Networks-Dilated Convolutions Network[J].Journal of Donghua University(English Edition),2021,38(4):341-350. 被引量：1
7陆清屿,李秋洁,童岳凯,王明霞,袁鹏成.基于Mask R⁃CNN的行道树实例分割方法[J].林业工程学报,2021,6(5):154-160. 被引量：7
8陈贵强,何军,罗顺茺.基于改进CycleGAN的视频监控人脸超分辨率恢复算法[J].计算机应用研究,2021,38(10):3172-3176. 被引量：10
9周宏辉,江炯,张平,郎庆凯,曹向勇.应用多重形态谱的船只红外尾迹图像细粒度识别研究[J].自动化技术与应用,2021,40(9):108-112.
10杨振东,曹亚龙,张巧玲,赵思茂,曹佳豪,吴峰,李国栋.含泄漏供水管道瞬变流动特征及泄漏定位[J].中国给水排水,2021,37(15):35-40. 被引量：1

计算机工程

2021年第10期

浏览历史

内容加载中请稍等...

基于可变形卷积的改进YOLO目标检测算法被引量：15

参考文献6

二级参考文献29

共引文献239

同被引文献145

引证文献15

二级引证文献111

相关作者

相关机构

相关主题

浏览历史

基于可变形卷积的改进YOLO目标检测算法 被引量：15

参考文献6

二级参考文献29

共引文献239

同被引文献145

引证文献15

二级引证文献111

相关作者

相关机构

相关主题

浏览历史

基于可变形卷积的改进YOLO目标检测算法被引量：15