题名 一种基于关键词的中文文档图像检索方法
被引量:5
1
作者
黄祥林
高芸
杨丽芳
王鹏鹏
机构
中国传媒大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2007年第4期61-64,72,共5页
基金
国家发改委CNGI资助项目(CNGI-04-12-2A)
文摘
本文提出了一种基于关键词的中文文档图像检索方法,能在不经OCR(Optical Character Recognition)识别的情况下,直接利用中文字符的图像特征进行关键词检索。首先将文档图像分割成单个中文字符图像,接着对字符图像进行汉字笔画的特征数据提取,然后在特征数据间进行基于WMHD(Weighted Modified Hausdorff Dis-tance)的相似性测量。该方法不受字号的影响,也有一定的抗字体能力,实验证明其具有较高的检索效果。
关键词
计算机应用
中文 信息处理
中文文档图像
关键词检索
加权的修正Hausdorff距离(WMHD)
Keywords
computer application
chinese information processing
chinese document image
retrieval by keywords
WMHD (Weighted Modified Hausdorff Distance)
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种中文文档图像中检索方法研究
2
作者
韩晓琴
机构
河南洛阳师范学院教育科学学院
出处
《电脑知识与技术(过刊)》
2009年第9X期7485-7486,共2页
文摘
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。
关键词
中文文档图像
字符切分
粗外围特征
HAUSDORFF距离
Keywords
chinese document images
character segmentation
coarse periphery feature
hausdorff distance
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于索引的快速手写中文文档关键词检索
被引量:2
3
作者
喻庚
殷飞
陈友斌
刘成林
机构
华中科技大学自动化学院
中国科学院自动化研究所模式识别国家重点实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2015年第11期1033-1040,共8页
基金
国家自然科学基金项目(No.61305005
61273269
61175021)资助
文摘
手写文档检索很难同时保证较高的检索精度和速度.基于上述原因,文中提出快速手写中文文档关键词检索方法,大幅提高检索速度并保持检索精度.该方法基于文本行识别的候选切分-识别网格预先生成压缩的索引文件,然后在索引上快速检索关键词.在手写中文文档数据库CASIA-HWDB上的实验证明文中方法的有效性,该方法不但压缩索引大小,而且缩短词检索的耗时.
关键词
手写中文文档图像
关键词检索
索引压缩
快速检索
Keywords
Handwritten Chinese Document Image, Keyword Spotting, Index Compression, Fast Retrieval
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]