-
题名基于有向单连通链的表格框线检测算法
被引量:23
- 1
-
-
作者
郑冶枫
刘长松
丁晓青
潘世言
-
机构
清华大学电子工程系
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第4期790-796,共7页
-
基金
国家自然科学基金资助项目(69972024)
863高科技发展计划基金资助项目(863-306-ZT03-03-1)
-
文摘
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点.
-
关键词
表格识别
图像分析
光学字符识别
智能文档处理
表格框线检测算法
有向单连通链
-
Keywords
form recognition
image analysis
line detection
optical character recognition (OCR)
intelligent document processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名任意倾角表格框线的快速检测
被引量:1
- 2
-
-
作者
周绍光
赵建泉
-
机构
河海大学测绘工程系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第3期277-279,共3页
-
文摘
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途径。算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值,进而沿着角度所指定的方向迅速搜索出边框线。整个检测方法的效率类似于投影法,同时可抗任意角度的旋转。
-
关键词
直线检测
表格框线检测
表格识别
图像分析
表格倾角检测
-
Keywords
line detection
form frame-line detection
form recognition
image analysis
form skew angle measurement
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名线宽阈值法去除表格框线
被引量:6
- 3
-
-
作者
郑冶枫
刘长松
丁晓青
-
机构
清华大学电子工程系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2001年第2期206-210,共5页
-
基金
国家863高技术计划
国家自然科学基金
-
文摘
字线交叠是表格处理中经常遇到的问题,它严重干扰了字符识别。本文提出一种基于线宽信息的表格框线去除算法—线宽阈值法。字符内采用较小的阈值去除框线,字符间采用较大的阈值,使本方法具有很好的抗噪声能力。针对数字与框线交叠的特殊情况,本文提出并比较了两种利用先验知识的方法:启发式先验知识法和识别反馈法。增值税发票的识别实验结果表明,本算法能使字线交叠情况下数字的识别率与字线不交叠的情况相当。
-
关键词
表格处理
表格框线
线宽阈值法
字符识别
计算机
-
Keywords
Form Processing, Character-Line Overlap, Form Frame Line Removal, Character Stroke Reservation
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-