-
题名基于模式链分析的文本页面图像的分割与分类
被引量:1
- 1
-
-
作者
李艳玲
王加俊
-
机构
苏州大学电子信息学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2005年第6期741-745,共5页
-
基金
国家自然科学基金项目(30300088)
-
文摘
为了能对复杂版式的文本图像(如包含镶嵌在文字中的形状不规则的图片区)的页面进行图文分割与分类,提出了一种新的基于模式链分析的文本页面分割与分类算法。该算法首先使用外接矩形框出图像中的所有黑像素,并且存入矩形框链表中,再组合所有相邻的矩形进而形成模式,最后依据各模式的统计特征分类,输出文字区和图片区两类图像。另外,对大图片模式周围个别不确定的模式,本文采用了上下文分类的算法进行再次分类。实验结果表明,该算法不仅运算速度快,而且能够对复杂版式的页面图像进行正确的图文分割和分类。
-
关键词
矩形框链表
模式链表
模式上下文
页面分割和分类
-
Keywords
rectangle-list, pattern-list, pattern context, page segmentation and classification
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
O4
[理学—物理]
-