-
题名基于特征的文档图像检索
被引量:2
- 1
-
-
作者
张田
王希常
尘昌华
-
机构
山东师范大学管理与经济学院
山东师范大学信息科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第22期176-178,共3页
-
基金
山东省自然科学基金资助项目(2005ZRB01001)
山东师范大学学位论文创新基金资助项目
-
文摘
提出一种综合利用文档图像的段落特征和局部像素分布相对差特征进行文档图像检索的方法。给出段落特征和局部像素分布相对差特征的定义、提取方法以及基于这2个特征结合使用的检索方法。段落特征这一全局特征以及局部像素分布相对差特征这一局部特征相结合能够较好地表征和区分文档图像,检索方法将两者充分结合取得较好的效果。
-
关键词
文档图像检索
全局特征
段落特征
局部特征
局部像素分布相对差
-
Keywords
document image retrieval
global feature
paragraph feature
local feature
local relative difference of pixel distributions
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名综合文字和非文字区域特征的文档图像检索
被引量:4
- 2
-
-
作者
张田
-
机构
山东大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第12期5-8,共4页
-
基金
国家自然科学基金重点项目No.60832008~~
-
文摘
提出一种改进的自适应文字区域提取算法,将文档图像分割成文字区域和非文字区域。对文字区域提取连通字符间空白、连通字符高度和宽度等局部特征,以及书写样式、段落特征等全局特征;对非文字区域,提取关键块特征。然后利用检索算法将文字区域特征和非文字区域特征结合起来,提高检索的准确性。同时,在检索算法中引入多维数据检索结构,有效地提高检索速度。通过对大规模文档数据库(包含12024个文档)的检索,表明该算法具有较高的效率,优于现有的一般文档图像检索算法。
-
关键词
文档图像检索
文字区域提取
段落特征
多维数据检索结构
-
Keywords
document image retrieval
text area extraction
paragraph feature
multi-dimensional retrieval structure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的房产档案特征提取与分类方法
被引量:1
- 3
-
-
作者
钱俊霖
余建桥
-
机构
西南大学数据库与智能检索实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第10期266-268,共3页
-
基金
重庆市自然科学基金资助项目(CSTC
2009BB2308)
中央高校基本科研业务费基金资助项目(XDJK2009C017)
-
文摘
针对房产电子档案分类与关键信息提取的问题,提出一种改进的特征提取与分类方法。将文档图像的段落特征和局部像素分布值特征作为房产文档图像的综合特征,利用模板训练支持向量机分类器,实现对入库的房产档案图像的自动分类。实验结果表明,该方法的分类效果和稳定性较好。
-
关键词
房产档案
段落特征
特征提取
档案分类
支持向量机分类器
局部特征
-
Keywords
house property archives
paragraph feature
feature extraction
archives classification
Support Vector Machine(SVM) classifier
local feature
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-