-
题名改进的文档图像扭曲校正方法
被引量:10
- 1
-
-
作者
宋丽丽
吴亚东
孙波
-
机构
西南科技大学智能电器与智能系统四川省高校重点实验室
西南科技大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第1期204-206,共3页
-
基金
国家自然科学基金资助项目(60802040)
西南科技大学博士研究基金资助项目(06ZX7120)
-
文摘
由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。
-
关键词
文档图像扭曲校正
图像内容分割
校正基线
-
Keywords
document image distortion correction
image content segmentation
correction baseline
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名文档图像几何畸变快速校正的新方法
被引量:3
- 2
-
-
作者
宋丽丽
吴亚东
孙波
-
机构
西南科技大学计算机科学与技术学院
西南科技大学智能电器与智能系统四川省高校重点实验室
西南科技大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2010年第A12期3317-3320,3324,共5页
-
基金
国家自然科学基金资助项目(60802040)
西南科技大学博士研究基金资助项目(06ZX7120)
-
文摘
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度,并与传统方法相比较,该算法的效率和鲁棒性较高。
-
关键词
文档图像几何畸变
连通域标记
中位点
校正基线
垂直位移距离
-
Keywords
document image distortion
connected components labeling
middle dot
correction baseline
vertical displace distance
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-