-
题名基于深度学习的工业视觉箱体字符识别与判断
被引量:3
- 1
-
-
作者
葛永杰
王丽丹
陈定喜
段书凯
干秀灵
-
机构
西南大学电子信息工程学院
智能传动和控制技术国家地方联合工程实验室
类脑计算与智能控制重庆市重点实验室
重庆市脑科学协同创新中心
美的集团
西南大学人工智能学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第1期296-304,共9页
-
基金
国家重点研发计划(2018YFB1306600)
国家自然科学基金(62076207,62076208,U20A20227,61672436)
重庆市基础科学与前沿技术研究专项重点项目(cstc2017jcyjBX0050)。
-
文摘
工厂生产线上的商品包装外箱文本印刷存在残缺,无法及时检出会影响流通销售。制作工业商品外观信息数据集,提出基于深度学习的工业视觉箱体字符识别与匹配判断方法。合并YOLOv3中的卷积层和批量归一化层,引入GIoU作为边界框损失函数并设计自适应调整定位坐标的方法,优化在原始图像上进行文本检测定位的速度与精度。同时,训练并对比CRNN和Tesseract两种识别引擎在已裁剪文本图片上的识别性能,设计字符匹配方法判断字符识别正确与否并输出结果,从而减少误判。对基于该方法的系统进行生产线实测,实验结果表明,其识别准确率可达99.5%,单件商品的外观拍照、检测识别、输出结果耗时仅3 s左右,表明所提方法能够实现实时监测。
-
关键词
深度学习
YOLOv3算法
卷积递归神经网络
字符识别
外观信息
实时监测
-
Keywords
deep learning
YOLOv3 algorithm
Convolutional Recurrent Neural Network(CRNN)
character recognition
appearance information
real-time monitoring
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-