-
题名改进YOLOv5的高精度跌倒检测算法
- 1
-
-
作者
朱胜豪
钱承山
阚希
-
机构
南京信息工程大学自动化学院
无锡学院物联网工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第11期105-114,共10页
-
基金
国家自然科学基金青年基金项目(42105143)
江苏省高等学校基础学科(自然科学)研究面上项目(580221016)
江苏省研究生实践创新计划(SJCX23_0397)。
-
文摘
针对原始YOLOv5在人体跌倒检测任务中无法有效应对复杂细节捕捉、变形处理、不同尺度目标适应和遮挡检测的困境,提出了一种基于C2D改进YOLOv5模型的新型高精度跌倒检测算法C2D-YOLO。给出了一种名为C2D的新型特征提取模块,通过融合可变形卷积、标准卷积和通道空间混合注意机制,将其添加到主干网络中,旨在增强特征表征能力,更好地捕捉复杂细节和处理变形。在颈部网络中,采用了Swin Transformer block替代C3模块的瓶颈层,旨在最大限度地保留特征信息,以提升对不同尺度目标的检测精度并改善遮挡情况下的性能。在借鉴YOLOX解耦结构的基础上对YOLOv5的Head模块进行改进,旨在优化分类和回归性能。实验结果表明,相比现有的YOLOv5s,该方法的mAP0.5和mAP0.5:0.95分别提高了3.2个百分点和6.5个百分点,明显提升了检测精度,减少了误检率。
-
关键词
YOLOv5
跌倒检测
C2D
swin
transformer
block
解耦结构
-
Keywords
YOLOv5
fall detection
C2D
swin transformer block
decoupled structure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进YOLOv5的安全帽佩戴检测算法
被引量:12
- 2
-
-
作者
乔炎
甄彤
李智慧
-
机构
河南工业大学信息科学与工程学院
粮食信息处理与控制重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第11期203-211,共9页
-
基金
河南省“揭榜挂帅”项目(211110110500)。
-
文摘
针对目前目标检测模型结构复杂、计算量大、检测准确率低等问题,提出在工业场景下基于改进型YOLOv5的安全帽佩戴算法。在主干网络引入轻量型网络ShuffleNetv2,保留Focus结构和ShuffleNetv2共同组成主干网络,降低网络的计算量和参数量;在C3模块中引入Swin Transformer Block,得到C3STB模块,替换Neck部分原有的C3模块;设计了CBAM_H注意力机制,并将其嵌入Neck网络中,获取全局上下文信息,提高模型检测准确率。自建数据集并进行实验,实验结果表明,改进后的YOLOv5模型的参数量由6.14×10^(6)压缩到8.9×10^(5),计算量由1.64×10^(10)压缩到6.2×10^(9),mAP由0.899上升到0.908,优于原模型性能。
-
关键词
YOLOv5
ShuffleNetv2
CBAM注意力机制
swin
transformer
block
-
Keywords
YOLOv5
ShuffleNetv2
CBAM attention mechanism
swin transformer block
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名改进YOLOv5的遥感图像目标检测
被引量:1
- 3
-
-
作者
周鹏成
黎远松
石睿
范贝贝
-
机构
四川轻化工大学计算机科学与工程学院
-
出处
《四川轻化工大学学报(自然科学版)》
CAS
2023年第2期57-66,共10页
-
基金
国家自然科学基金青年基金项目(41604154)。
-
文摘
针对遥感图像在目标检测任务中存在目标小、背景复杂、密集分布导致检测精度低的问题,提出了一种改进YOLOv5的遥感图像目标检测算法。首先在主干网络中引入了Swin Transformer Block模块增强网络的特征提取能力;其次在特征融合层使用更高效的加权双向特征金字塔;然后在特征金字塔结构中添加卷积注意力模块来增强网络对有效特征信息的提取;最后在预测层中引入EIoU损失函数进行坐标框定位,提高预测框的回归精度和收敛速度。通过在公开的NWPU VHR–10数据集上实验表明改进后的算法平均精度均值达到了94.6%,与YOLOv5相比提高了3.3%,并且与其他主流算法相比平均精度均值和FPS均有较大的优势。
-
关键词
目标检测
遥感图像
swin
transformer
block
特征金字塔
注意力机制
-
Keywords
object detection
remote sensing image
swin transformer block
feature pyramid
attention mechanisms
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-