-
题名基于改进Hough变换的文本图像倾斜校正方法
被引量:33
- 1
-
-
作者
周冠玮
平西建
程娟
-
机构
信息工程大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2007年第7期1813-1816,共4页
-
文摘
文本图像在扫描输入时产生的倾斜现象会对后续的页面分割及光学字符识别(OCR)处理产生很大的影响,而传统的标准Hough变换虽然具有对噪声不敏感,不依赖于直线连续性的优点,但由于计算量偏大,速度慢,在实用时有较大的局限性。提出一种基于改进的Hough变换的文本图像倾斜校正方法,通过在变分辨率图像中采用不同的文本方向提取算法,及选择合理投票门限等改进Hough变换的措施,减小了由图像区域及文字笔画粗细所产生的对倾角判定的不利影响,并使用基于偏移值的方法实现页面倾斜的快速校正。实验结果表明,该算法实现了大范围高精度的文本图像倾角的快速检测,具有较强的实用性。
-
关键词
文本图像
HOUGH变换
数学形态学
游程平滑
变分辨率图像
-
Keywords
document image
Hough transform
morphology
run-length smoothing
multi-resolution image
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于图像信息度量与关键词的邮件智能分类系统
- 2
-
-
作者
周冠玮
程娟
平西建
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第15期199-201,共3页
-
文摘
如何利用邮件的正文与附件信息有效地实现其分类,是现在邮件处理领域一个重要的课题。该文从商业应用角度提出了一种基于图像信息度量与关键词的邮件智能过滤与分发方法,通过基于朴素贝叶斯分类器的邮件关键词信息处理,及附件图像信息的基于归一化PIM文本图像检测理论的分析,能够综合运用邮件正文、地址等文本信息与附件图像信息作为分类的评价参数,有效地实现了邮件的智能分类。
-
关键词
多用途网际邮件扩充协议
BASE64
图像信息度量
朴素贝叶斯
-
Keywords
multipurpose Internet mail extensions(MIME)
Base64
picture information measurement(PIM)
Native Bayes
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多特征和SVM的文本图像版面分类方法
被引量:6
- 3
-
-
作者
程娟
平西建
周冠玮
-
机构
解放军信息工程大学信息工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2008年第5期569-574,共6页
-
文摘
对文本图像的灰度、形状和纹理等视觉特征进行了较为全面的分析,研究了版面中文本、表格、图形和图像在各种特征层面上的差异。针对中英文版面,结合投影法与连通域分析快速准确的分割图像,提取了能够表征区域信息的17维特征向量,然后使用基于正态决策树的多分类支持向量机将文本图像版面区域分为文本、表格、图形和图像四类。实验结果表明算法能够快速、准确地处理文本图像版面,具有较强的应用价值。
-
关键词
版面分割
灰度特征
形状特征
纹理特征
支持向量机
-
Keywords
page segmentation
gray feature
shape feature
texture feature
support vector machine
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-