-
题名多知识综合判决的字符切分算法
被引量:5
- 1
-
-
作者
刘刚
丁晓青
彭良瑞
刘长松
-
机构
清华大学电子工程系智能技术与系统国家重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第17期59-61,72,共4页
-
基金
国家863高技术研究发展计划(编号:2001AA114081)
国家自然科学基金(编号:69972024)
-
文摘
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。
-
关键词
多知识综合判决
字符切分算法
光学字符识别
上下文分析
文字识别
印刷体识别系统
-
Keywords
optical character recognition,character segmentation,contextual analysis
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于连通域的版面分割方法
被引量:7
- 2
-
-
作者
郭丽
孙兴华
王正群
杨静宇
-
机构
南京理工大学计算机科学系
清华大学计算机系人机交互与媒体集成研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第5期105-107,共3页
-
文摘
版面分割是版面分析的重要组成部分,是一个受到广泛关注的研究课题。该文提出了一种基于连通域的版面分割算法,首先对文档图像进行倾斜校正,然后采用模糊处理以得到较大的连通单元,再根据区域连通的特性进行版面分割和处理。实验表明,基于连通域的算法分割版面准确,速度快,适用范围广,不仅可用于矩形版面,对于非Manhattan版面等复杂版面也能取得令人满意的效果。
-
关键词
连通域
版面分割方法
版面分析
动态聚类法
图像模糊
印刷体文字识别系统
-
Keywords
layout analysis,connective region,dynamic clustering method,image smearing,page segmentation
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-