针对工业生产流水线中工件识别速度慢、精度低的问题,提出1种基于改进YOLOv5(You Only Look Once v5)的工件识别方法,称为YOLO_Meta。对YOLOv5原有的网络架构进行多个阶段的调整,包括利用双路注意力机制模块和深度可分离卷积改进主干特...针对工业生产流水线中工件识别速度慢、精度低的问题,提出1种基于改进YOLOv5(You Only Look Once v5)的工件识别方法,称为YOLO_Meta。对YOLOv5原有的网络架构进行多个阶段的调整,包括利用双路注意力机制模块和深度可分离卷积改进主干特征提取网络,可以更全面地提取特征;引入1种新型解耦头增强模型对各层级特征图的利用效率;利用聚类算法计算随机锚框相似度,对先验框进行过滤以及加入标签平滑算法等。基于MS COCO数据集和自制工件数据集进行实验并根据模型深度和宽度将模型分为大、中、小3款。实验结果表明:在MS COCO数据集上,大、中、小3款模型对比原模型的AP分别提高了3.4%、1.8%、6.9%。在自制工件数据集上,大模型对比原模型mAP提高了19.1%,F1分数提高了15.2%。文章提出的YOLO_Meta模型与原始模型相比,无论是稳定性还是准确率都有很大的提升,可为工件检测任务提供参考。展开更多
目的舰船舷号检测识别是海面态势感知的关键技术,精准的舷号检测识别对海洋权益保护具有重要意义。但目前没有公开数据提供支持。为此,本文先构建了一个真实场景下的稀疏舰船舷号数据集(sparse ship hull number dataset in real scene,...目的舰船舷号检测识别是海面态势感知的关键技术,精准的舷号检测识别对海洋权益保护具有重要意义。但目前没有公开数据提供支持。为此,本文先构建了一个真实场景下的稀疏舰船舷号数据集(sparse ship hull number dataset in real scene,SSHN-RS),包含3004幅舰船图像,共计11328个舷号字符,覆盖了多国、各类、水平、倾斜、背景简单、背景复杂、光线不佳和被遮挡的舰船舷号样本,是一个具有挑战性的数据集。基于SSHN-RS,开展舰船舷号检测识别研究,其主要难点在于:1)样本稀疏,模型容易过拟合;2)舷号字符分布密集,网络难以充分提取各字符特征;3)部分字符存在嵌套区域和相似区域,网络会识别出大量冗余结果。针对上述难点,提出了一种基于多视角渐进式上下文解耦的舰船舷号检测识别算法。方法首先,引入一个固定中心和最大化面积的随机透视变换技术,在不增加样本数量的前提下扩充舷号姿态,实现了数据增广,提升了模型的泛化能力;其次,提出了一个渐进式上下文解耦技术,先通过依次擦除舷号各字符生成一系列新样本,再利用特征提取网络提取和融合各样本的多尺度特征,不仅减少字符上下文信息对特征学习的干扰,而且再次增广了数据;最后,在测试阶段,提出了一个掩码间扰动抑制技术,先根据预测结果采用与渐进式上下文解耦技术类似的方法生成新样本并重新进行预测,再引入一个1维非极大值抑制技术去除预测结果中错误的冗余字符,输出最佳检测识别结果,进一步优化网络性能。结果在SSHN-RS上采用主流实例分割算法进行定性和定量评估。在定量评估上,本文算法舷号的检测精确率、召回率、F值和识别率分别可达0.9854,0.9576,0.9713,0.9018,均优于其他算法。相比指标排名第2的算法,分别提高了4.51%,3.45%,3.97%,8.83%;在定性评估上,本文算法更适合舰船舷号检测识别任务,检测识别性能更高。此外,本文算法可以泛化到其他实例分割算法中,以经典算法Mask RCNN(mask region based convolutional neural network)为例,加入本文算法各模块后,各指标分别提升了9.82%,6.04%,7.80%,6.73%。结论本文算法可以解决舷号检测识别任务中因样本稀疏、舷号分布密集、部分字符存在嵌套和相似性带来的问题,在主观和客观上均取得了最先进的性能,并且具有通用性。SSHN-RS可通过https://github.com/Bingchuan897/SSHN-RS获取。展开更多
文摘针对工业生产流水线中工件识别速度慢、精度低的问题,提出1种基于改进YOLOv5(You Only Look Once v5)的工件识别方法,称为YOLO_Meta。对YOLOv5原有的网络架构进行多个阶段的调整,包括利用双路注意力机制模块和深度可分离卷积改进主干特征提取网络,可以更全面地提取特征;引入1种新型解耦头增强模型对各层级特征图的利用效率;利用聚类算法计算随机锚框相似度,对先验框进行过滤以及加入标签平滑算法等。基于MS COCO数据集和自制工件数据集进行实验并根据模型深度和宽度将模型分为大、中、小3款。实验结果表明:在MS COCO数据集上,大、中、小3款模型对比原模型的AP分别提高了3.4%、1.8%、6.9%。在自制工件数据集上,大模型对比原模型mAP提高了19.1%,F1分数提高了15.2%。文章提出的YOLO_Meta模型与原始模型相比,无论是稳定性还是准确率都有很大的提升,可为工件检测任务提供参考。
文摘目的舰船舷号检测识别是海面态势感知的关键技术,精准的舷号检测识别对海洋权益保护具有重要意义。但目前没有公开数据提供支持。为此,本文先构建了一个真实场景下的稀疏舰船舷号数据集(sparse ship hull number dataset in real scene,SSHN-RS),包含3004幅舰船图像,共计11328个舷号字符,覆盖了多国、各类、水平、倾斜、背景简单、背景复杂、光线不佳和被遮挡的舰船舷号样本,是一个具有挑战性的数据集。基于SSHN-RS,开展舰船舷号检测识别研究,其主要难点在于:1)样本稀疏,模型容易过拟合;2)舷号字符分布密集,网络难以充分提取各字符特征;3)部分字符存在嵌套区域和相似区域,网络会识别出大量冗余结果。针对上述难点,提出了一种基于多视角渐进式上下文解耦的舰船舷号检测识别算法。方法首先,引入一个固定中心和最大化面积的随机透视变换技术,在不增加样本数量的前提下扩充舷号姿态,实现了数据增广,提升了模型的泛化能力;其次,提出了一个渐进式上下文解耦技术,先通过依次擦除舷号各字符生成一系列新样本,再利用特征提取网络提取和融合各样本的多尺度特征,不仅减少字符上下文信息对特征学习的干扰,而且再次增广了数据;最后,在测试阶段,提出了一个掩码间扰动抑制技术,先根据预测结果采用与渐进式上下文解耦技术类似的方法生成新样本并重新进行预测,再引入一个1维非极大值抑制技术去除预测结果中错误的冗余字符,输出最佳检测识别结果,进一步优化网络性能。结果在SSHN-RS上采用主流实例分割算法进行定性和定量评估。在定量评估上,本文算法舷号的检测精确率、召回率、F值和识别率分别可达0.9854,0.9576,0.9713,0.9018,均优于其他算法。相比指标排名第2的算法,分别提高了4.51%,3.45%,3.97%,8.83%;在定性评估上,本文算法更适合舰船舷号检测识别任务,检测识别性能更高。此外,本文算法可以泛化到其他实例分割算法中,以经典算法Mask RCNN(mask region based convolutional neural network)为例,加入本文算法各模块后,各指标分别提升了9.82%,6.04%,7.80%,6.73%。结论本文算法可以解决舷号检测识别任务中因样本稀疏、舷号分布密集、部分字符存在嵌套和相似性带来的问题,在主观和客观上均取得了最先进的性能,并且具有通用性。SSHN-RS可通过https://github.com/Bingchuan897/SSHN-RS获取。