改进YOLOv7的航拍图像目标检测

Improved YOLOv7 for UAV Image Object Detection

下载PDF

导出

摘要航拍图像目标检测对于高效解译航拍图像,并用于地图绘制、资源普查、城乡规划等领域有着重大现实意义。针对无人机航拍图像中的物体尺度变化大、易受到背景干扰和微小目标容易错检漏检的问题,提出一种基于YOLOv7进行改进的航拍图像目标检测算法(AirYOLOv7)。AirYOLOv7通过在原网络的特征提取阶段结合三维注意力机制,在特征融合阶段结合通道注意力机制,以帮助模型更好地聚焦于图像中的关键信息。考虑到航拍图像中存在许多微小物体,算法额外增加了一个用于检测微小物体的预测头,并在每个预测头前引入C3STB,以增强算法对不同尺度目标的检测能力。针对IoU损失对微小物体的位置偏差非常敏感,通过在原边框回归损失中引入Wasserstein距离来衡量微小物体之间的差异,以提高算法对微小物体的检测能力。实验结果表明,AirYOLOv7在DOTA和VisDrone这两个公开的光学航拍数据集上的mAP分别达到78.65%和51.79%,相较于原始的YOLOv7分别提高了1.92个百分点和2.28个百分点,证明了改进方法在光学航拍图像上的有效性。 Aerial image target detection has significant practical implications for efficient interpretation of aerial images and applications in mapping,resource inventory,urban and rural planning,etc.To address challenges in UAV aerial images,such as varying object scales,background interference,and missing detection of small targets,propose an improved algo-rithm called AirYOLOv7,based on YOLOv7.Firstly,AirYOLOv7 combines a three-dimensional attention mechanism during feature extraction and a channel attention mechanism during feature fusion in the original network.These mecha-nisms help the model focus on crucial information in the image.Secondly,because of the prevalence of small objects in aerial images,the algorithm adds an additional prediction head for detecting small objects.The algorithm also incorpo-rates the C3STB before each prediction head to improve detection capability for objects of different scales.Additionally,the algorithm addresses the sensitivity of the IoU loss to positional deviations for small objects by introducing the Wasser-stein distance into the original bounding box regression loss.This measure helps improve the detection capability for small objects.Experimental results demonstrate that the effectiveness of AirYOLOv7 on two publicly available optical aerial datasets,DOTA and VisDrone achieves mean average precision of 78.65%and 51.79%on these datasets,respectively,showing improvements of 1.92 percentage points and 2.28 percentage points comparing to the original YOLOv7 which validates the effectiveness of the proposed improvements on optical aerial images.

作者邹振涛李泽平 ZOU Zhentao;LI Zeping(State Key Laboratory of Public Big Data,Guiyang 550025,China;School of Computer Science and Technology,Guizhou University,Guiyang 550025,China)

机构地区公共大数据国家重点实验室贵州大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第8期173-181,共9页 Computer Engineering and Applications

基金国家自然科学基金(61462014)。

关键词目标检测航拍图像注意力机制损失函数 Swin Transformer YOLOv7 object detection UAV images attention mechanism loss function Swin Transformer YOLOv7

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：105
2李坤亚,欧鸥,刘广滨,于泽峰,李林.改进YOLOv5的遥感图像目标检测算法[J].计算机工程与应用,2023,59(9):207-214. 被引量：18
3冒国韬,邓天民,于楠晶.基于多尺度分割注意力的无人机航拍图像目标检测算法[J].航空学报,2023,44(5):268-278. 被引量：14
4苏俊楷,段先华,叶赵兵.改进YOLOv5算法的玉米病害检测研究[J].计算机科学与探索,2023,17(4):933-941. 被引量：17
5赵振兵,王帆帆,刘良帅,赵建利.基于注意力特征融合YOLOv5模型的无人机输电线路航拍图像金具检测方法[J].电测与仪表,2023,60(3):145-152. 被引量：15
6胡皓,郭放,刘钊.改进YOLOX-S模型的施工场景目标检测[J].计算机科学与探索,2023,17(5):1089-1101. 被引量：11
7董刚,谢维成,黄小龙,乔逸天,毛骞.深度学习小目标检测算法综述[J].计算机工程与应用,2023,59(11):16-27. 被引量：15

二级参考文献40

1王森,杨克俭.基于双线性插值的图像缩放算法的研究与实现[J].自动化技术与应用,2008,27(7):44-45. 被引量：80
2金立军,闫书佳,刘源.基于类Haar特征与级联AdaBoost算法的防震锤识别[J].系统仿真学报,2012,24(9):1806-1809. 被引量：34
3汤踊,韩军,魏文力,丁建,彭新俊.深度学习在输电线路中部件识别与缺陷检测的研究[J].电子测量技术,2018,41(6):60-65. 被引量：83
4马先红,李峰,宋荣琦.玉米的品质特性及综合利用研究进展[J].粮食与油脂,2019,32(1):1-3. 被引量：30
5高强,廉启旺.航拍图像中绝缘子目标检测的研究[J].电测与仪表,2019,56(5):119-123. 被引量：29
6裴伟,许晏铭,朱永英,王鹏乾,鲁明羽,李飞.改进的SSD航拍目标检测方法[J].软件学报,2019,30(3):738-758. 被引量：64
7戚银城,江爱雪,赵振兵,郎静宜,聂礼强.基于改进SSD模型的输电线路巡检图像金具检测方法[J].电测与仪表,2019,56(22):7-12. 被引量：46
8杨罡,孙昌雯,张娜,晋涛,徐澄宇,吴庭栋,张兴忠.基于多尺度特征融合的输电线路关键部件检测[J].电测与仪表,2020,57(3):54-59. 被引量：19
9张东,邱翔,曹成功,朱劲波.结合聚合通道和复频域特征的防震锤检测算法[J].计算机技术与发展,2020,30(3):147-151. 被引量：7
10谌贵辉,易欣,李忠兵,钱济人,陈伍.基于改进YOLOv2和迁移学习的管道巡检航拍图像第三方施工目标检测[J].计算机应用,2020,40(4):1062-1068. 被引量：10

共引文献179

1李健,庞留记,吴浩,王心宇.融合注意力机制的改进Mask-RCNN遥感影像建筑物提取[J].测绘科学,2024,49(1):79-89.
2杨阳,王媛青,李石磊,卢立峰.结合LSTM与Attention的高速公路路段旅行时间预测方法[J].交通与运输,2022,38(3):61-64.
3宋晓玲,刘勇,董景楠,黄勇飞.元宇宙中区块链的应用与展望[J].网络与信息安全学报,2022,8(4):45-65. 被引量：7
4周孟然,李学松,朱梓伟,黄凯文.井下矿工多目标检测与跟踪联合算法[J].工矿自动化,2022,48(10):40-47. 被引量：4
5蔡标,葛成,徐晴,陆翼,孔韧,常珊.基于Transformer网络的抗癌肽的预测[J].现代计算机,2022,28(18):9-15. 被引量：1
6王剑,王晓锋.基于VGG-19和Vision Transformer的乳腺超声图像分类方法[J].信息技术与信息化,2022(11):25-28.
7王延军,陈亚男,姚志鹏.基于机器视觉测试高锰酸盐指数的方法研究[J].环境科技,2022,35(6):51-54. 被引量：2
8王恒涛,张上,陈想,贾付文.轻量化无人机航拍目标检测算法[J].电子测量技术,2022,45(19):167-174. 被引量：9
9戚婧,阮广聪,杨毅,吴毅,曹倩,魏艳玲,粘永健.空间双线性注意力网络识别溃疡性结肠炎与克罗恩病[J].陆军军医大学学报,2023,45(3):227-234.
10惠巧娟,孙婕.基于多尺度特征度量元学习的玉米叶片病害识别模型研究[J].江苏农业科学,2023,51(9):199-206. 被引量：4

1朱佳男,艾芊,李嘉媚.基于分布鲁棒优化的广义共享储能容量配置方法[J].电力系统自动化,2024,48(8):185-194. 被引量：1
2张昀,黄橙,施健,张玉瑶,黄经纬,于舒娟,黄丽亚.一种基于生成对抗架构的目标检测增强算法[J].计算机学报,2024,47(3):647-661. 被引量：1
3陈霆,雷洋,白堂博,许贵阳.基于改进YOLOv7模型的地铁隧道衬砌表观病害检测方法[J].铁道建筑,2024,64(3):94-99.
4张智泉,陈晓杰,符杨,李振坤,邓莉荣.基于核仁聚类估计和数据驱动分布鲁棒优化的海量异构产消者联盟能量管理策略[J].电力系统保护与控制,2024,52(7):98-114.
5魏昊坤,刘敬一,陈金勇,楚博策,孙裕鑫,朱进.基于L-FPN的无人机上小目标识别模型轻量化方法[J].航空兵器,2024,31(1):97-102.
6刘国新,朱福珍,巫红.改进YOLOv5的遥感图像目标检测[J].黑龙江大学自然科学学报,2024,41(1):109-115.
7周建民,沈熙闻,刘露露.结合WGAN GP与CNN SVM的滚动轴承故障红外诊断[J].激光与红外,2024,54(3):416-422.
8王若璇,李野,赵鹏.融合双向路由注意力的多尺度X光违禁品检测[J].计算机科学与应用,2024,14(3):78-95.
9樊伟,范英,谭忠富,鞠立伟,姚星.基于多层利益共享的虚拟电厂参与电碳市场分布鲁棒优化模型[J].系统工程理论与实践,2024,44(2):661-683. 被引量：3
10Tianwei W.Zhang,Xiaoyu Y.Dong,Xu Sun,Lianru R.Gao,Ying Qu,Bing Zhang,Ke Zheng.Performance releaser with smart anchor learning for arbitrary‐oriented object detection[J].CAAI Transactions on Intelligence Technology,2023,8(4):1213-1225.

计算机工程与应用

2024年第8期

浏览历史

内容加载中请稍等...

改进YOLOv7的航拍图像目标检测

参考文献7

二级参考文献40

共引文献179

相关作者

相关机构

相关主题

浏览历史