期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Tesseract-OCR的复杂发票自适应识别 被引量:7
1
作者 孙瑞彬 钱夔 +1 位作者 徐伟敏 路红 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2021年第3期349-354,共6页
针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域... 针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域线段,进行表格位置提取,并结合表格交点坐标与自定义模板,实现表头与内容自适应适配;最后利用jTessBoxEditor对表格区域内容进行字库训练优化,最终实现基于Tesseract-OCR的字符识别.实验结果表明该方法具有高准确识别率,支持感兴趣区域自适应识别,具备高可用性. 展开更多
关键词 发票识别 Tesseract-OCR OPENCV 字库训练 自适应识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部