基于深度学习的图片中商品参数识别方法被引量：15

Deep Learning for Parameter Recognition in Commodity Images

下载PDF

导出

摘要计算机计算性能的提升使得深度学习成为了可能.作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业.受限于网络的复杂度和检测算法的设计,目标检测的速度和精度成为一个trade-off.目前电商领域的飞速发展产生了大量包含商品参数的图片,使用传统方法难以有效地提取出图片中的商品参数信息.针对这一问题,提出了一种将深度学习检测算法和传统OCR技术相结合的方法,在保证识别速度的同时大大提升了识别的精度.所研究的问题包括检测模型、针对特定数据训练、图片预处理以及文字识别等.首先比较了现有的目标检测算法,权衡其优缺点,然后使用YOLO模型完成检测任务,并针对YOLO模型中存在的不足进行了一定的改进和优化,得到了一个专用于检测图片中商品参数的目标检测模型,最后使用tesseract完成文字提取任务.在将整个流程结合到一起后,该系统不仅有着较好的识别精度,而且是高效和健壮的.最后讨论了优势和不足之处,并指出了未来工作的方向. The improvements of computing performance make deep learning possible.As one of the important research directions in the field of computer vision,object detection has combined with deep learning methods and is widely used in all walks of life.Limited by the complexity of the network and the design of the detection algorithm,the speed and precision of the object detection becomes a trade-off.At present,the rapid development of electronic commerce has produced a large number of pictures containing the product parameters.The traditional method is hard to extract the information of the product parameters in the picture.This paper presents a method of combining deep learning detection algorithm with the traditional OCR technology to ensure the detection speed and at the same time greatly improve the accuracy of recognition.The paper focuses the following problems：The detection model,training for specific data,image preprocessing and character recognition.First,existing object detection algorithms are compared and their advantages and disadvantages are assessed.While the YOLO model is used to do the detection work,some improvements is proposed to overcome the shortcomings in the YOLO model.In addition,an object detection model is designed to detect the product parameters in images.Finally,tesseract is used to do the character recognition work.The experimental results show that the new system is efficient and effective in parameter recognition.At the end of this paper,the innovation and disadvantage of the presented method are discussed.

作者丁明宇牛玉磊卢志武文继荣 DING Ming-Yu;NIU Yu-Lei;LU Zhi-Wu;WEN Ji-Rong(Beijing Key Laboratory of Big Data Management and Analysis Methods （School of Information, Renmin University of China）, Beijing 100872, China)

机构地区大数据管理与分析方法研究北京市重点实验室(中国人民大学信息学院)

出处《软件学报》 EI CSCD 北大核心 2018年第4期1039-1048,共10页 Journal of Software

基金国家自然科学基金(61573363) 北京市科委类脑计算专项(Z171100000117009) 中国人民大学预研委托项目(15XNLQ01) 中国人民大学拔尖创新人才培育资助计划~~

关键词目标检测图像切割光学字符识别商品参数深度学习 object detection image segmentation optical character recognition product parameters deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘真,吴泉源.通用表格处理系统中定位方法的研究[J].软件学报,1996,7(7):409-414. 被引量：1
2李星原,高文.一种鲁棒性的结构未知表格分析方法[J].软件学报,1999,10(11):1216-1224. 被引量：4
3张群会.表格数据自动识别技术研究[J].西安科技学院学报,2000,20(4):353-355. 被引量：4
4房婧,高良才,仇睿恒,汤帜.版式电子文档表格自动检测与性能评估[J].北京大学学报（自然科学版）,2013,49(1):45-53. 被引量：3
5郑冶枫,刘长松,丁晓青,潘世言.基于有向单连通链的表格框线检测算法[J].软件学报,2002,13(4):790-796. 被引量：23

二级参考文献35

1张炘中.汉字识别技术[M].北京:清华大学出版社,1992,9..
2李星原.表格自动阅读研究（博士学位论文）[M].哈尔滨工业大学,1997..
3沈清，1993年
4李星原，博士学位论文，1997年
5Yu B，IEEE Trans Pattern Anal Machine Intell，1996年，18卷，11期，1127页
6Fan K C，Proc 3rd International Conference on Document Analysis and Recognition，1995年，623页
7Liu J，Proc 3rd International Conference on Document Analysis and Recognition，1995年，579页
8Watanabe T，IEEE Trans Pattern Anal Machine Intell，1995年，7卷，4期，432页
9Wang D，Proc lst lnternational Conference on Document Analysis and Recognition. AFCET- IRlSA / INRIA，1991年，181页
10Illingworth,J.,Kittler,J.A survey of the hough transform.Computer Vision,Graphics,and Image Processing,1988,44(1):87～116.

共引文献28

1周绍光,辛莉,田林亚.利用数字影像中直线的结构特征检测直线段[J].计算机工程与应用,2004,40(22):71-74. 被引量：3
2郑秀清,付茂名.一种改进的自动表格框线检测方法[J].中国民航飞行学院学报,2004,15(4):30-32. 被引量：2
3陈优广,顾国庆,张薇,许彦冰.一种新的表格单元格矩形识别算法[J].计算机工程,2006,32(13):9-11. 被引量：3
4李艳霞,孙羽菲,张玉志.受限表格识别系统的研究[J].计算机工程与应用,2006,42(31):161-163. 被引量：6
5吕亚军,陈继荣.基于最优坐标系的表格版面分析[J].计算机仿真,2007,24(4):211-215.
6卜飞宇,刘长松.基于边缘检测的多文本页图像分割方法[J].计算机工程与设计,2007,28(8):1861-1863. 被引量：2
7周绍光,赵建泉.任意倾角表格框线的快速检测[J].计算机工程,2008,34(3):277-279. 被引量：1
8张艳,郁生阳,张重阳,杨静宇.表格型票据中框线检测与去除算法[J].计算机研究与发展,2008,45(5):909-914. 被引量：5
9刘艳顺,邱泽阳.一种基于自适用结构元素的表格框线去除形态学算法[J].贵州大学学报（自然科学版）,2008,25(4):350-353.
10章胜玲,张蓉生,李娜,李立.图像稠密坐标网格的去除[J].水电能源科学,2009,27(4):74-76.

同被引文献107

1张晶,李雅琴,王博文.光学字符识别(OCR)技术在内部审计中的实践应用[J].纳税,2020,14(1):275-275. 被引量：5
2卢海燕,游诚曦.接触网成像检测系统运用[J].铁路技术创新,2014(3):37-40. 被引量：2
3李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
4彭朝勇,高晓蓉.国外接触网导线磨耗检测系统[J].中国铁路,2007(4):66-68. 被引量：10
5高丽,令晓明.一种基于模糊增强的多尺度边缘检测算法[J].兰州交通大学学报,2008,27(4):106-108. 被引量：3
6李涛.胶济客专接触网定位管斜拉线应用分析技术[J].山西建筑,2009,35(15):255-257. 被引量：3
7张霞,王素贞,尹怡欣,赵海龙.基于模糊粒度计算的K-means文本聚类算法研究[J].计算机科学,2010,37(2):209-211. 被引量：12
8韩树文.《商品名称及编码协调制度》及其在我国的应用[J].条码与信息系统,2010(1):34-35. 被引量：2
9刘超,周激流,何坤.基于Canny算法的自适应边缘检测方法[J].计算机工程与设计,2010,31(18):4036-4039. 被引量：30
10何震.针对OCR准确度不高的金融票据电子化解决方案[J].金融科技时代,2011,19(8):69-69. 被引量：1

引证文献15

1许重建,李险峰.基于深度学习的HS Code产品归类方法研究[J].现代计算机,2019,25(1):11-19. 被引量：1
2马永杰,宋晓凤.基于YOLO和嵌入式系统的车流量检测[J].液晶与显示,2019,34(6):613-618. 被引量：16
3胜献利.深度学习下大学生资助管理模式创新研究[J].重庆理工大学学报（自然科学）,2019,33(7):167-171.
4阿卜杜外力·如则,帕力旦·吐尔逊,阿布都萨拉木·达吾提,艾斯卡尔·艾木都拉.基于深度学习的多方向维吾尔文区域检测[J].电视技术,2019,43(11):71-78.
5游诚曦.基于接触网成像技术的定位管斜拉线故障检测方法[J].中国铁路,2020(1):93-98. 被引量：2
6夏昌新,莫浩泓,王成鑫,王瑶,闫仕宇.基于深度学习的图像文字识别技术研究与应用[J].软件导刊,2020,19(2):127-131. 被引量：11
7李菊霞.基于深度学习的二值图像目标轮廓识别算法[J].吉林大学学报（理学版）,2020,58(5):1189-1194. 被引量：11
8程博,张开洋,唐波,付震坤,胡义勇.基于深度学习的供应商资质证书智能识别技术研究[J].数字通信世界,2021(4):79-82. 被引量：1
9朱学岩,张新伟,顾梦梦,赵燕东,陈锋军.基于无人机可见光图像的云杉计数方法[J].林业工程学报,2021,6(4):140-146. 被引量：7
10王一海.基于BP神经网络的产品商标鉴别系统研究[J].电子器件,2021,44(6):1516-1519. 被引量：1

二级引证文献53

1杨晋生,杨雁南,李天骄.基于深度可分离卷积的交通标志识别算法[J].液晶与显示,2019,34(12):1191-1201. 被引量：13
2刘衍和.基于点云数据和图像处理技术的高速公路车辆流量检测[J].系统仿真技术,2021,17(1):64-68. 被引量：1
3张宇,徐浩然,牛家俊,涂淑琴,赵文锋.基于YOLOv4和双重回归的复杂环境檀香树缺苗定位方法[J].农业机械学报,2022,53(11):299-305.
4储泽楠,韩毅,宋倍倍.基于嵌入式GPU的车流量检测系统[J].河南科技,2020,0(5):29-31. 被引量：2
5秦嘉,曹雪虹,焦良葆.基于深度学习的安全帽佩戴检测与跟踪[J].计算机与现代化,2020(6):1-6. 被引量：7
6李琦,尚绛岚,李宝山.基于头部图像特征的草原羊自动计数方法[J].中国测试,2020,46(11):20-24. 被引量：7
7陈科峻,张叶.基于YOLO-v3模型压缩的卫星图像船只实时检测[J].液晶与显示,2020,35(11):1168-1176. 被引量：12
8张瑞琰,姜秀杰,安军社,崔天舒.面向光学遥感目标的全局上下文检测模型设计[J].中国光学,2020,13(6):1302-1313. 被引量：13
9袁伟,郭欣,田红楠.病例文字识别与提取方法综述[J].机电产品开发与创新,2020,33(6):138-140. 被引量：1
10刘寿鑫,龙伟,李炎炎,程鸿.融合彩色模型空间的非线性低照度图像增强[J].四川大学学报（自然科学版）,2021,58(1):51-58. 被引量：10

1何江龙.合江农商行：提升后督系统OCR识别率[J].当代县域经济,2018,0(5):96-96.
2天涯衰草.QQ直接识别提取图片文字[J].电脑爱好者,2017,0(21):52-52.
3向着人工智能教育新时代前进[J].师资建设,2018,31(1):32-32.
4黄志超,程俊,管昌海,王九州.汽车扭力梁后悬架模态分析[J].机械设计与研究,2018,34(1):107-112. 被引量：11
5李永翠,王罡,刘耀辉,吴波.集装箱码头智能闸口应用综述[J].中国科技成果,2018,19(1):27-28. 被引量：1
6张明杰.基于经验包络法的非线性系统参数识别[J].计算力学学报,2018,35(1):123-127. 被引量：2
7老万.如何识别图片中的文字信息[J].电脑爱好者,2018,0(2):40-40.
8赵亚男,王履程,张冰涛.基于视频分析的电视视频监测技术[J].广播与电视技术,2017,44(10):128-131. 被引量：2
9杨慧,万云龙,刘佳玮,曹亚.基于LMD非线性特征参数识别的结构动态检测研究[J].四川建筑科学研究,2017,43(6):47-51. 被引量：2
10冯国健.转角遇到创意——书脊工艺引发的美术课堂创意[J].中小学教材教学,2018,0(2):64-67.

软件学报

2018年第4期

浏览历史

内容加载中请稍等...

基于深度学习的图片中商品参数识别方法被引量：15

参考文献5

二级参考文献35

共引文献28

同被引文献107

引证文献15

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于深度学习的图片中商品参数识别方法 被引量：15

参考文献5

二级参考文献35

共引文献28

同被引文献107

引证文献15

二级引证文献53

相关作者

相关机构

相关主题

浏览历史

基于深度学习的图片中商品参数识别方法被引量：15