-
题名一种快速有效的印刷体文字识别算法
被引量:13
- 1
-
-
作者
任金昌
赵荣椿
张炜
-
机构
西北工业大学计算机科学与工程系
-
出处
《中国图象图形学报(A辑)》
CSCD
北大核心
2001年第10期1011-1015,共5页
-
基金
陕西省科技研究计划发展项目 ( 98K0 7-J2 )
-
文摘
为了利用低成本的硬件来实现对印刷体文字的快速识别 ,提出了一种基于多级分类的印刷体文字快速识别算法 ,该算法从预处理、特征提取 ,到模式匹配各个阶段 ,都对传统方法作了合理的改进 .该算法首先是采用 36×36 ,而不是传统的 48× 48点阵进行归一化 ,从而有效地减少了计算量和字典容量 ;其次是采用改进的粗外围特征 ,并进行二重分割 ,以提高特征的稳定性 ;最后在各级分类中采用了不同的判别准则 ,包括绝对值距离、欧氏距离及相似度准则 ,以适应于时间、准确性的不同要求 .同时用该算法对一级汉字 70 0 0个样本进行了实验 ,其结果表明 ,实际正确识别率 (正识率 )达 95 % ,前 5位累积正识率可达 98% ,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础 .
-
关键词
印刷体
文字识别
多级分类
规范化
粗外围特征
平均线密度
特征提取
识别算法
-
Keywords
Machine printed character recognition, Multi-stages classification, Normalization, Coarse periphery feature, Average line density
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名一种中文文档图像中检索方法研究
- 2
-
-
作者
韩晓琴
-
机构
河南洛阳师范学院教育科学学院
-
出处
《电脑知识与技术(过刊)》
2009年第9X期7485-7486,共2页
-
文摘
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。
-
关键词
中文文档图像
字符切分
粗外围特征
HAUSDORFF距离
-
Keywords
chinese document images
character segmentation
coarse periphery feature
hausdorff distance
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-