-
题名基于深度学习的图片中商品参数识别方法
被引量:15
- 1
-
-
作者
丁明宇
牛玉磊
卢志武
文继荣
-
机构
大数据管理与分析方法研究北京市重点实验室(中国人民大学信息学院)
-
出处
《软件学报》
EI
CSCD
北大核心
2018年第4期1039-1048,共10页
-
基金
国家自然科学基金(61573363)
北京市科委类脑计算专项(Z171100000117009)
+1 种基金
中国人民大学预研委托项目(15XNLQ01)
中国人民大学拔尖创新人才培育资助计划~~
-
文摘
计算机计算性能的提升使得深度学习成为了可能.作为计算机视觉领域的重要发展方向之一的目标检测也开始结合深度学习方法并广泛应用于各行各业.受限于网络的复杂度和检测算法的设计,目标检测的速度和精度成为一个trade-off.目前电商领域的飞速发展产生了大量包含商品参数的图片,使用传统方法难以有效地提取出图片中的商品参数信息.针对这一问题,提出了一种将深度学习检测算法和传统OCR技术相结合的方法,在保证识别速度的同时大大提升了识别的精度.所研究的问题包括检测模型、针对特定数据训练、图片预处理以及文字识别等.首先比较了现有的目标检测算法,权衡其优缺点,然后使用YOLO模型完成检测任务,并针对YOLO模型中存在的不足进行了一定的改进和优化,得到了一个专用于检测图片中商品参数的目标检测模型,最后使用tesseract完成文字提取任务.在将整个流程结合到一起后,该系统不仅有着较好的识别精度,而且是高效和健壮的.最后讨论了优势和不足之处,并指出了未来工作的方向.
-
关键词
目标检测
图像切割
光学字符识别
商品参数
深度学习
-
Keywords
object detection
image segmentation
optical character recognition
product parameters
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-