期刊文献+

基于YOLOv5的无人机航拍改进目标检测算法Dy-YOLO 被引量:3

Dy-YOLO:Improved UAV Image Target Detection Algorithm Base on YOLOv5
下载PDF
导出
摘要 由于无人机航拍具有场景复杂多样,目标尺度变化剧烈,高速低空运动模糊等诸多特性,给目标检测带来了很大的挑战。针对无人机航拍目标检测效果不佳的问题,提出了Dy-YOLO模型,在YOLOv5的基础上引入Dynamic Head注意力,从尺度感知、空间位置、多任务3个角度探索具有注意力机制的预测头潜力;设计了C3-DCN结构和Dynamic Head注意力相互配合增强特征提取能力;此外,还使用SimOTA标签分配方式来弥补小样本的损失,并使用CARAFE(content-aware resssembly of features)上采样算子,有效增强了不同卷积特征图的融合效果。在VisDrone2019测试集上,Dy-YOLO检测的平均均值精度达到了38.2%,较基线方法YOLOv5提高了7.1%,同时与主流的检测方法相比也取得更高的检测精度。结果表明,Dy-YOLO算法对于无人机航拍检测任务具有较好的性能。 UAV aerial photography presents significant challenges,including intricate and diverse scenes,significant variations in target scale,and high-speed,low-altitude motion blur.To address poor performance of object detection in UAV aerial photography,the Dy-YOLO model is introduced.It integrates Dynamic Head attention into YOLOv5,exploring the potential of prediction heads with attention mechanisms related to scale awareness,spatial location,and multitasking.Additionally,a C3-DCN structure and Dynamic Head attention complement each other,enhancing feature extraction performance.The SimOTA label assignment compensates for small sample losses,while the CARAFE(Content-Aware ReAssembly of FEatures)upsampling operator effectively improves the fusion of convolutional feature maps.Dy-YOLO achieves an average mean accuracy of 38.2%on the VisDrone2019 test set,marking a 7.1 percentage points improvement over the baseline YOLOv5 method.It also outperforms the majority of object detection algorithms,demonstrating its effectiveness in UAV aerial photography object detection tasks.
作者 杨秀娟 曾智勇 YANG Xiujuan;ZENG Zhiyong(School of Computer and Cyber Security,Fujian Normal University,Fuzhou 350117,China)
出处 《福建师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期76-86,共11页 Journal of Fujian Normal University:Natural Science Edition
基金 福建省自然科学基金资助项目(2022J01187) 福建省引导性项目(2021Y0011)。
关键词 目标检测 注意力机制 无人机航拍 YOLOv5 可变形卷积网络 object detection attention mechanism unmanned aerial vehicle(UAV) YOLOv5 deformable convolution networks
  • 相关文献

参考文献1

二级参考文献3

  • 1Rafael CG,Richard EW.数字图像处理[M].阮秋琦,阮宇智译.北京:电子工业出版社,2003.
  • 2KRUGLINSKI D J.Visual C++技术内幕[M].潘爱民,王国印,译.北京:清华大学出版社,1999.
  • 3Donald Hearn等.计算机图形学.蔡士杰等[M].北京:电子工业出版社,2007

共引文献80

同被引文献16

引证文献3

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部