摘要
人工方式核验日益增长的网店工商扫描件信息,存在着工作量巨大,因疏忽导致信息录入错误,工作效率和准确性低下等问题。针对以上问题,提出了设计实现基于OCR技术的文字系统。系统主要基于Java语言、Open CV库以及POI工具包进行实现,通过对工商信息扫描图像进行水印去除、灰度化及二值化等预处理,利用水平、垂直投影进行字符切分,采用Open CV相关库函数进行字符识别,最后使用POI工具将识别后的数据写入Excel文件。结果表明,网店工商信息识别提取系统的识别速度快、识别率高。识别系统是很有现实意义的。
作者
高洪坤
任焕海
GAO Hongkun;REN Huanhai
出处
《信息技术与信息化》
2021年第7期51-54,共4页
Information Technology and Informatization
基金
山东华宇工学院2020年度科技计划项目“基于深度学习的企业实体识别研究”(编号:2020KJ10)阶段性成果。