-
题名基于直线段检测器的多阈值图像表格框线提取算法
被引量:2
- 1
-
-
作者
刘云锴
彭程
边赟
-
机构
中国科学院成都计算机应用研究所
中国科学院大学
-
出处
《计算机应用》
CSCD
北大核心
2021年第S01期250-254,共5页
-
基金
四川省重点研发项目(18ZDYF3994)。
-
文摘
针对传统表格结构识别算法中,前期图像预处理工作量大、复杂表格结构识别率低、高分辨率和高复杂度表格时间开销过于大的问题,提出先对图像表格结构利用直线段检测器进行框线检测,再利用双阈值直线判断规则,对本应属于同一直线的多条线段进行合并细化,最后对横纵线交点处缺失或过长线段,采用表格结构整体框线对齐的快速识别算法。实验结果表明,该算法既可以对图像高分辨率下简单表格和复杂表格准确识别,也可以满足图像低分辨率中简单表格和复杂表格的识别需求,可以容忍一定倾斜角度,因此减少了图像预处理工作,缩短了检测时间,甚至可以对非严格定义表格结构进行精准识别,进一步推动图像表格结构通用识别算法的进程。
-
关键词
表格结构
直线段检测器
框线检测
合并细化
框线对齐
-
Keywords
table structure
line segment detector
frame line detection
merge and refinement
frame line alignment
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-