-
题名基于稀疏可学习proposal的车间工具目标检测
- 1
-
-
作者
刘珍兵
孙巧榆
王述文
夏嘉伟
-
机构
江苏海洋大学电子工程学院
-
出处
《电子测量与仪器学报》
CSCD
北大核心
2024年第7期13-21,共9页
-
基金
国家自然科学基金(62271236)项目资助。
-
文摘
针对车间工具不同型号之间尺寸存在较大差异、形状种类繁多等问题,提出了一种基于稀疏可学习proposal的车间工具检测算法。首先,融入稀疏表示和可学习的proposal机制来提升模型的鲁棒性,并减少检测过程中所需的参数量;其次,引入Swin-Transformer结构,旨在增强模型的全局以及细节学习能力,有效地解决传统卷积神经网络在高层语义信息融合方面存在的不足;然后,使用一种改进的多尺度特征融合网络架构,通过有效融合不同尺度的特征,提高了模型对于各种尺度目标的检测能力;最后,将多头注意力和动态卷积结合,在不同特征层之间建立更精确且细致的联系,从而进一步提升了目标检测的准确性;采用了CIoU损失函数,通过综合考虑位置、尺度和形状信息,使得模型对边界框的回归预测更加全面与准确。实验结果显示,本文算法在车间工具目标检测任务上的平均检测精度达到了91%,较当前主流算法至少提升了2.3%以上。同时,单张图片的检测速度大约为53 ms,满足了实时检测的需求,体现了综合性能优越。
-
关键词
工具检测
稀疏可学习
多尺度特征
Swin-Transformer
多头注意力
-
Keywords
tool detection
sparse and learnable
multi-scale features
Swin-Transformer
multi-head attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TN9
[电子电信—信息与通信工程]
-