-
题名基于改进的YOLOv5的大坝表面病害检测算法
被引量:1
- 1
-
-
作者
段升位
程欣宇
王浩舟
王飞
-
机构
公共大数据国家重点实验室(贵州大学)
中国电建集团贵阳勘测设计研究院有限公司
-
出处
《计算机应用》
CSCD
北大核心
2023年第8期2619-2629,共11页
-
基金
贵州省水利厅科研项目(KT202010)。
-
文摘
针对当前水利大坝主要依靠人工现场巡视,运营成本高且效率低的问题,提出一种基于YOLOv5的改进检测算法。首先,采用改进的多尺度的视觉Transformer结构改进主干网络,并利用多尺度Transformer结构关联的多尺度全局信息和卷积神经网络(CNN)提取的局部信息来构建聚合特征,从而充分利用多尺度的语义信息和位置信息来提高网络的特征提取能力。然后,在网络的每个特征检测层前加入同位注意力机制,以在图像的高度和宽度方向分别进行特征编码,再用编码后的特征构建特征图上像素的长距离关联,从而增强网络在复杂环境中的目标定位能力。接着,改进了网络正负训练样本的采样算法,通过构建先验框与真实框的平均契合度和差异度筛选样本来辅助候选正样本与自身形状相近的先验框产生响应,以帮助网络更快、更好地收敛,从而提升网络的整体性能和网络泛化性。最后,针对应用需求对网络进行了轻量化,并通过对网络结构剪枝和结构重参数化优化网络结构。实验结果表明:在当前采用的大坝病害数据上,对比原始YOLOv5s算法,改进后的网络mAP@0.5提升了10.5个百分点,mAP@0.5:0.95提高了17.3个百分点;轻量化后的网络对比轻量化之前的网络的参数量和计算量分别降低了24%和13%,检测速度提升了42%,满足当前应用场景下病害检测精度和速度的要求。
-
关键词
目标检测
工程缺陷
YOLOv5
多尺度视觉Transformer
同位注意力机制
大坝病害
-
Keywords
object detection
engineering defect
YOLOv5
multi-scale visual Transformer
coordinate attention mechanism
dam disease
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-