基于深度学习的工业视觉箱体字符识别与判断被引量：3

Character Recognition and Judgment of Industrial Vision Box Based on Deep Learning

下载PDF

导出

摘要工厂生产线上的商品包装外箱文本印刷存在残缺,无法及时检出会影响流通销售。制作工业商品外观信息数据集,提出基于深度学习的工业视觉箱体字符识别与匹配判断方法。合并YOLOv3中的卷积层和批量归一化层,引入GIoU作为边界框损失函数并设计自适应调整定位坐标的方法,优化在原始图像上进行文本检测定位的速度与精度。同时,训练并对比CRNN和Tesseract两种识别引擎在已裁剪文本图片上的识别性能,设计字符匹配方法判断字符识别正确与否并输出结果,从而减少误判。对基于该方法的系统进行生产线实测,实验结果表明,其识别准确率可达99.5%,单件商品的外观拍照、检测识别、输出结果耗时仅3 s左右,表明所提方法能够实现实时监测。 If the incomplete text printing on commodity packaging boxes produced by factory production lines cannot be detected in time,the sales and circulation of the commodities will be affected.This paper presents a deep learning-based box character recognition and matching method for industrial vision,and also makes a data set of industrial commodity appearance information for the method.By merging the convolutional layer and the batch normalization layer of YOLOv3,and introducing GIoU as the loss function of the boundary box,a method for adaptive positioning coordinate adjustment is designed,which improves the speed and accuracy of text detection and location on the original image.Then the recognition performance of the trained CRNN and Tesseract engines on cropped text images is compared.The designed character matching method is used to judge whether the character recognition result is correct,and the result is output,which reduces the misjudgment.The system based on this method is tested on a production line,and the experimental results show that the system displays an accuracy of 99.5%.It takes about 3 s to take a photo of the appearance,detect and recognize the characters,and output the result of a single product,which demonstrates that the proposed method enables real-time monitoring.

作者葛永杰王丽丹陈定喜段书凯干秀灵 GE Yongjie;WANG Lidan;CHEN Dingxi;DUAN Shukai;GAN Xiuling(College of Electronic and Information Engineering,Southwest University,Chongqing 400715,China;National and LocalJoint Engineering Laboratory of Intelligent Transmission and Control Technology,Chongqing 400715,China;Chongqing Key Laboratory of Brain-Inspired Computing and Intelligent Control,Chongqing 400715,China;Chongqing Brain Science Collaborative Innovation Center,Chongqing 400715,China;Midea Group,Foshan,Guangdong 528311,China;School of Artificial Intelligence,Southwest University,Chongqing 400715,China)

机构地区西南大学电子信息工程学院智能传动和控制技术国家地方联合工程实验室类脑计算与智能控制重庆市重点实验室重庆市脑科学协同创新中心美的集团西南大学人工智能学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第1期296-304,共9页 Computer Engineering

基金国家重点研发计划(2018YFB1306600) 国家自然科学基金(62076207,62076208,U20A20227,61672436) 重庆市基础科学与前沿技术研究专项重点项目(cstc2017jcyjBX0050)。

关键词深度学习 YOLOv3算法卷积递归神经网络字符识别外观信息实时监测 deep learning YOLOv3 algorithm Convolutional Recurrent Neural Network(CRNN) character recognition appearance information real-time monitoring

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1陈玄,朱荣,王中元.基于融合卷积神经网络模型的手写数字识别[J].计算机工程,2017,43(11):187-192. 被引量：25
2史建伟,章韵.基于改进YOLOv3和BGRU的车牌识别系统[J].计算机工程与设计,2020,41(8):2345-2351. 被引量：13
3郭晓峰,王耀南,毛建旭.基于几何特征的IC芯片字符分割与识别方法[J].智能系统学报,2020,15(1):144-151. 被引量：8
4程淑红,周斌.基于改进CNN的铝轮毂背腔字符识别[J].计算机工程,2019,45(5):182-186. 被引量：7
5何鎏一,杨国为.基于深度学习的光照不均匀文本图像的识别系统[J].计算机应用与软件,2020,37(6):184-190. 被引量：8

二级参考文献20

1吴文昌.中国IC产业分析综述[J].经济师,2006(6):36-37. 被引量：4
2芮挺,沈春林,丁健,张金林.基于主分量分析的手写数字字符识别[J].小型微型计算机系统,2005,26(2):289-292. 被引量：22
3洪留荣,王耀才.应用图论和基元方向信息的手写数字识别[J].计算机工程,2006,32(3):34-36. 被引量：8
4闫蓓,王斌,李媛.基于最小二乘法的椭圆拟合改进算法[J].北京航空航天大学学报,2008,34(3):295-298. 被引量：203
5陈海峰,雷华,孔燕波,周柳云,冯华君.基于最小二乘法的改进的随机椭圆检测算法[J].浙江大学学报（工学版）,2008,42(8):1360-1364. 被引量：39
6蒋联源.Fast detection of multi-circle with randomized Hough transform[J].Optoelectronics Letters,2009,5(5):397-400. 被引量：10
7黄瀚敏,汪先矩,易正俊,马笑潇.一种基于特征提取的手写字符识别技术[J].重庆大学学报（自然科学版）,2000,23(1):66-69. 被引量：8
8吴成茂.直方图均衡化的数学模型研究[J].电子学报,2013,41(3):598-602. 被引量：101
9余永维,殷国富,殷鹰,杜柳青.基于深度学习网络的射线图像缺陷识别方法[J].仪器仪表学报,2014,35(9):2012-2019. 被引量：75
10潘炜深,金连文,冯子勇.基于多尺度梯度及深度神经网络的汉字识别[J].北京航空航天大学学报,2015,41(4):751-756. 被引量：19

共引文献56

1李怡轩.基于机器学习的手写数字识别系统设计与实现[J].微型电脑应用,2018,34(8):78-81. 被引量：4
2崔丽.基于深度学习的字符识别技术研究[J].自动化技术与应用,2018,37(11):120-125. 被引量：2
3钱勇生,邵洁,季欣欣,李晓瑞,莫晨,程其玉.基于改进卷积神经网络的多视角人脸表情识别[J].计算机工程与应用,2018,54(24):12-19. 被引量：22
4何平,刘紫燕.基于改进多层感知机的手写数字识别[J].通信技术,2018,51(9):2075-2080. 被引量：11
5周林勇,谢晓尧,刘志杰,任笔墨.卷积神经网络池化方法研究[J].计算机工程,2019,45(4):211-216. 被引量：12
6桂江生,麻陈飞,包晓安,钱俊彦.递归深度混合关注网络的细粒度图像分类方法[J].计算机工程,2019,45(5):205-209. 被引量：6
7申肖阳.基于caffe的手写数字识别研究与实现[J].邯郸职业技术学院学报,2019,32(1):51-53.
8高树辉,姜晓佳.卷积神经网络在物证检验中的应用与毛发自动识别的展望[J].科学技术与工程,2019,19(23):1-9. 被引量：4
9林仁耀,邓浩伟,兰红.卷积神经网络结合SVM的手写数字识别算法[J].通信技术,2019,52(10):2389-2394. 被引量：7
10蔡玉婷,王外忠,杜孟杰,杨鑫,周铁军.数字字符识别技术及应用[J].电子技术与软件工程,2019,0(21):66-68. 被引量：3

同被引文献23

1邓晓刚.过程控制实验装置的机理建模与虚拟仿真软件开发[J].实验室研究与探索,2015,34(10):99-103. 被引量：13
2李蓉娟.包装物料形状特征提取和识别方法[J].包装工程,2020,41(5):209-213. 被引量：11
3郭振东.人工智能在计算机网络技术中的应用探究[J].信息通信,2020,0(1):74-75. 被引量：7
4高波,刘志明,霍凯,焦风川.基于虚拟仿真的高速动车组检修工艺实验教学系统开发[J].实验技术与管理,2020,37(3):139-142. 被引量：10
5刘程,魏人权.KDF4成型机滤棒隐形追溯防伪识别技术研究[J].装备制造技术,2020(6):119-121. 被引量：3
6徐勐,芦幸琪,马阳光,孙明轩.计算机断层扫描的虚拟仿真软件开发[J].数字技术与应用,2020,38(9):106-108. 被引量：1
7林峰,陈天凡,赵仕宇.智能制造自动化生产线的仿真搭建[J].现代计算机,2020,26(27):106-108. 被引量：1
8许旭萍,陈景华,黄一翔,郭晓岩,胡海川.产品外包装点阵喷码字符识别研究[J].上海包装,2020(5):32-35. 被引量：2
9苏楷.胶囊药丸包装的机器视觉与射频识别技术的应用研究[J].包装与食品机械,2020,38(6):51-55. 被引量：4
10陈雨,陈桂雄,周雄图,张永爱,林志贤,吴朝兴,郭太良.基于DeepLabv3的随机褶皱防伪图案识别研究[J].信息技术与网络安全,2021,40(2):39-44. 被引量：1

引证文献3

1李征.融合人工智能的虚拟仿真实践教学探索[J].数字技术与应用,2022,40(3):215-217. 被引量：5
2孙雪姣,肖诗斌,都云程.基于改进CRNN算法的专利附图标记识别[J].软件导刊,2022,21(12):38-45.
3马丽霞.产品外包装隐形激光全息防伪识别方法[J].激光杂志,2024,45(7):249-254.

二级引证文献5

1倪艳凤,倪艳荣,张开拓,郑先锋,解瑞云.新工科实践教学基地建设研究与实践[J].创新创业理论研究与实践,2023(6):131-133. 被引量：1
2赵秀芝.人工智能专业实践教学机制构建[J].生产力研究,2022(11):128-132.
3王庞伟,王天任,刘小明,张名芳,熊昌镇.基于数字孪生的人工智能产业人才培养模式[J].实验室研究与探索,2023,42(8):192-196. 被引量：4
4祝智颖,周伟辉.虚拟现实与人工智能的融合研究[J].移动信息,2023,45(11):148-150.
5季桉宁.融合人工智能的交通管理工程虚拟仿真教学方法研究[J].现代盐化工,2024,51(4):136-137.

1王娟,陈艳华,王燕.儿童输注夫西地酸钠致静脉炎的风险管理研究进展[J].药物评价研究,2021,44(10):2274-2279.
2段荧,龙华,瞿于荃.中文文字图片同色长干扰线的去除算法[J].数据通信,2021(4):42-46. 被引量：2
3马立骥,姜祖桢.提升戒毒人员“戒毒免疫力”的方法研究[J].中国监狱学刊,2021,36(5):132-135.
4高磊滔,张学东.徽州竹雕造型元素在文创产品设计中的应用研究[J].山东工艺美术学院学报,2021(5):99-103.
5史君,吕永恒.如何消除食品质谱分析的基质效应[J].中国食品工业,2022(1):54-55. 被引量：3
6易梦馨,吴江,蔡婧璇,高嘉慧.信任视角下基于文本图片多源信息的在线择医行为研究[J].情报科学,2021,39(9):84-93. 被引量：10
7何佳强.大学生篮球裁判预判能力的培养探析[J].当代体育科技,2021,11(30):51-53. 被引量：2
8赵格,赵建梅,王琳,王君玮,刘娜,刘俊辉,曲志娜,王娟,张喜悦.畜禽产品中微生物风险评估和预警系统的构建与初步应用[J].中国动物检疫,2021,38(11):44-53.
9聂鑫苗,张新安,曹丽华.运动捕捉技术在体育运动领域的应用[J].体育科技,2021,42(4):52-56. 被引量：3
10杨光,任宇航,王超,王伟,钦兰云,周思雨,李播博.航空关键零部件激光增材高性能精准修复技术[J].中国科技成果,2021(22):16-17.

计算机工程

2022年第1期

浏览历史

内容加载中请稍等...

基于深度学习的工业视觉箱体字符识别与判断被引量：3

参考文献5

二级参考文献20

共引文献56

同被引文献23

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于深度学习的工业视觉箱体字符识别与判断 被引量：3

参考文献5

二级参考文献20

共引文献56

同被引文献23

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于深度学习的工业视觉箱体字符识别与判断被引量：3