-
题名基于底层图像特征组合的文本图像分类研究
被引量:2
- 1
-
-
作者
曾东红
黄朝志
黄细妹
-
机构
江西理工大学电气工程与自动化学院
江西理工大学信息工程学院
-
出处
《江西理工大学学报》
CAS
2013年第5期82-87,共6页
-
基金
国家自然科学基金资助项目(70971043)
江西省自然科学基金项目(2008GZS0028)
-
文摘
针对文本图像特有的图像特征,提出了一种基于底层图像特征组合的文本图像分类方法,该方法使用了两层C4.5决策树分类器,能将文本图像有效地分为标题文本图像、文档图像和场景文本图像.首先将样本图像转换为灰度图像,提取灰度直方图的特征,根据灰度直方图特征的不同,可以先区分文档图像;然后把余下的图像转换为二值图像,提取图像的GLCM纹理特征,根据GLCM特征区分场景文本和标题文本图像.在开源的WEKA数据挖掘软件环境下进行仿真实验,结果表明该方法是可行的,并能够得到较高的查全率和查准率.
-
关键词
文本图像
C4
5决策树分类器
灰度直方图
图像纹理
-
Keywords
text image
C4.5 decision tree classifier
gradation histogram
image texture
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-