-
题名基于有向单连通链的表格框线检测算法
被引量:23
- 1
-
-
作者
郑冶枫
刘长松
丁晓青
潘世言
-
机构
清华大学电子工程系
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第4期790-796,共7页
-
基金
国家自然科学基金资助项目(69972024)
863高科技发展计划基金资助项目(863-306-ZT03-03-1)
-
文摘
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点.
-
关键词
表格识别
图像分析
光学字符识别
智能文档处理
表格框线检测算法
有向单连通链
-
Keywords
form recognition
image analysis
line detection
optical character recognition (OCR)
intelligent document processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名一种表格框线检测和字线分离算法
被引量:11
- 2
-
-
作者
刘长松
潘世言
郑冶枫
丁晓青
-
机构
清华大学电子工程系智能技术与系统国家重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2002年第9期1190-1196,共7页
-
基金
国家863计划
国家自然科学基金
-
文摘
该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精确地提取表格框线,具有抗倾斜,抗断裂,抗字线交叠等优点。在此基础上,提出了一种能够分离交叠字线的表格框线去除算法,并成功应用于实际的表格识别系统中。
-
关键词
字线分离算法
表格识别
图像分析
直线检测
字符识别
有向单连通链
-
Keywords
Form recognition, linage analysis, Line detection, Character recognition
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-