-
题名一种复杂版面扭曲文档图像快速校正方法
被引量:4
- 1
-
-
作者
曾凡锋
段漾波
-
机构
北方工业大学计算机学院
-
出处
《计算机应用与软件》
CSCD
2016年第6期172-175,286,共5页
-
基金
国家自然科学基金项目(61371142)
北京市自然科学基金项目(4132026)
-
文摘
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。
-
关键词
复杂版面
扭曲文档
形态学组件
窗口扫描校正
-
Keywords
Complex layout
Warped document
Morphologic component
Windows scanning correction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于页眉线的扭曲文档图像快速校正方法
- 2
-
-
作者
曾凡锋
段漾波
-
机构
北方工业大学计算机学院
-
出处
《图学学报》
CSCD
北大核心
2016年第1期79-83,共5页
-
基金
国家自然科学基金项目(61371142)
-
文摘
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显,对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR识别率大幅度提高。
-
关键词
计算机应用
扭曲文档
页眉页脚线
等比距离
图像校正
-
Keywords
computer application
warped document
header and footer line
geometric distance
image correct
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-