基于Gabor滤波器的数字文档图像文字提取算法被引量：4

Gabor Filter Based Text Extraction from Digital Document Images

下载PDF

导出

摘要本文提出一种在数字文档图像中自动检测和提取文字的算法.首先对图像在不同方向和阶数上进行Gabor滤波,得到反映文档图像布局的滤波图像,然后在得到的滤波图像中直接提取候选文字区域,再利用几何特性和高频分量特性筛选准则从中剔除非文字区域.最后选取了不同类型、不同语言和不同字体的文档图像进行实验,实验结果表明本算法对各种文档图像均能给出满意的结果. This paper presents an algorithm that can automatically detect and extract text in digital document images. Firstly, we process and fuse Gabor filtered images at different orientations and scales and obtain an image that reflects the layout of the document image. Then, potential text regions are directly extracted from the resulting image. Finally, two criteria based on the geometrical property and high frequency content are adopted to kick-out those non-text regions. The experiments are performed on some representative images with different styles and with texts in different languages and fonts. Experimental results show that the algorithm works well on document images from a wide variety of source.

作者付平李孟尹洪涛

机构地区哈尔滨工业大学

出处《电子学报》 EI CAS CSCD 北大核心 2006年第B12期2387-2390,共4页 Acta Electronica Sinica

关键词文字提取 GABOR滤波器数字文档图像 text extraction Gabor filter digital document images

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献14

1F M Wahl, K Y Wong, R G Casey. Block segmentation and text extraction in mixed text/image document [ J ]. Computer Graphics and Image Processing, 1982,20(4) :375 - 390.
2K Y Wong, R G Casey, F M Wahl. Document analysis system[J] .IBM Journal Res. Dev, 1982,26(6) :647 - 656.
3D Wang, S N Srihari. Classification of newspaper image blocks using texture analysis [ J ]. Computer Graphics and Image Processing, 1989,47(3 ) :327 - 352.
4L O'Gorman. The document spectrum for page layout analysis[J]. IEEE Trans Pattern Analysis and Machine Intelligence,1993,15(11) :1162- 1173.
5A K Jain, S Bhattacharjee. Text segmentation using Gabor filters for automatic document processing[ J]. Machine Vision and Applications, 1992,5(3) : 169 - 184.
6A K Jain, Y Zhong. Page segmentation using texture analysis[J] .PR, 1996,29(5) :743 - 770.
7K Etemad, D Doermann, R Chellappa. Multiscale document page segmentation using soft decision integration [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(1) :92 - 96.
8S S Raju,P B Pati,A G Ramakrishnan. Gabor filter based block energy analysis for text extraction from digital document images[A]. Proceedings of the First International Workshop on Document Image Analysis for Libraries [ C ]. Palo Alto, California,USA: IEEE, 2004.233 - 243.
9S S Raju, P B Pail, A G Ramakrishnan. Text localization and extraction from complex color images[ J]. International Symposium on Visual Computing 2005, LNCS-3804:486 - 493.
10S Mao, T Kanungo. Emprirical performance evaluation methodology and its application to page segmentation algorithms[J] .PAMI,2001,23(3) :242 - 256.

同被引文献33

1谢安明,邵美珍,李弼程.基于小波的图象放大模型分析[J].信息工程大学学报,2000,1(2):57-60. 被引量：3
2马敏,许微,郝魁红,侯正信.图像修复的邻域差值扩散模型[J].计量学报,2009,30(5):409-412. 被引量：3
3王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
4郭丽,孙兴华,黄元元,杨静宇.视频文本的自动提取方法[J].小型微型计算机系统,2004,25(6):1086-1088. 被引量：5
5王建,周源华.一种基于纹理能量的JPEG图像文本定位算法[J].上海交通大学学报,2004,38(9):1492-1495. 被引量：4
6葛晓菁,张宏喜,李兰英.图像检索中纹理特征提取的研究[J].哈尔滨理工大学学报,2005,10(1):122-124. 被引量：10
7刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
8高平利,任金昌,赵荣椿.非压缩域数字视频中文字的检测与提取[J].中国体视学与图像分析,2004,9(4):244-248. 被引量：1
9夏莹,马少平,孙茂松,朱小燕,金奕江,李国华.计算机语言学方法在中文文字识别后处理中的应用[J].中文信息,1996(2):50-51. 被引量：1
10胡小锋,周勇,叶庆泰.复杂背景彩色图像中的文字分割[J].光学技术,2006,32(1):141-143. 被引量：12

引证文献4

1江延湖,白似雪.复杂背景图像文本信息提取技术研究[J].江西教育学院学报,2008(3):18-21.
2田其冲,董恒强,何新求.静态图像提取文字技术[J].电脑编程技巧与维护,2008(9):96-97. 被引量：1
3张凯歌,缪毅,雷建坤,彭可亮,蒋慕蓉.结合小波插值与K-means方法提取彩色图像文字[J].计算机技术与发展,2013,23(3):31-33. 被引量：3
4刘明珠,郑云非,樊金斐,于芳.基于深度学习法的视频文本区域定位与识别[J].哈尔滨理工大学学报,2016,21(6):61-66. 被引量：11

二级引证文献15

1赵磊,郭晶,吴潇.静态低分辨率长微博图片的文字提取效果对比分析[J].中国电子商情（通信市场）,2013(1):149-155.
2郭庆春,郝源,李雪,杜北方,张向阳.BP神经网络在长江水质COD预测中的应用[J].计算机技术与发展,2014,24(4):235-238. 被引量：14
3秦伟.基于聚类及融合技术的数字图像文字提取与识别研究[J].电子技术与软件工程,2014(9):111-111.
4王卫兵,徐倩,韩再博.基于最优质量传输光流法和神经网络的火焰和烟雾检测[J].哈尔滨理工大学学报,2017,22(1):86-90. 被引量：4
5许鸿奎,邵星,韩晓,宫淑兰,王兆斌.基于堆栈自编码的刻划字符检测研究[J].山东建筑大学学报,2018,33(5):24-30.
6杨敏.基于文本识别的图书智能管理[J].自动化技术与应用,2018,37(12):145-150. 被引量：1
7江春.基于改进深度学习算法的区域实时定位方法研究[J].中国电子科学研究院学报,2019,14(6):599-604. 被引量：1
8曲媛媛,宫莉莹,贺维.一种RNN-DBN的网络购物风险评估方法[J].哈尔滨理工大学学报,2019,24(4):105-109. 被引量：3
9许洪军,张洪,贺维.一种基于鼠标行为的云用户异常检测方法[J].哈尔滨理工大学学报,2019,24(4):127-132. 被引量：6
10张春祥,李海瑞,高雪瑶.一种受限玻尔兹曼机的词义消歧方法[J].哈尔滨理工大学学报,2019,24(5):116-121. 被引量：2

1姜明芳,张纳新.联合可逆可见水印与数字指纹的文档图像版权保护方案[J].世界科技研究与发展,2014,36(6):643-646. 被引量：1
2刘靖,李翠华,杨敦旭.一种基于超像素的户外建筑图像布局标定方法[J].厦门大学学报（自然科学版）,2010,49(2):175-180. 被引量：3
3黄德才,钟艳平,胡嘉.基于主色调的图像布局特征提取及相似性匹配算法[J].浙江工业大学学报,2007,35(1):46-50. 被引量：1
4肖志涛,伊靓,李月龙,张芳,耿磊,吴骏.基于筛选评估准则的非正面人脸合成方法[J].天津工业大学学报,2015,34(2):69-74. 被引量：2
5吕晓琪,李永毅,张宝华,钟雪丽.基于医学影像工作站的图像布局显示技术研究[J].内蒙古科技大学学报,2011,30(1):51-55.
6金秋春,童小利,薄树奎.面向虹膜识别的Gabor特征筛选研究[J].计算机工程与应用,2012,48(19):201-204.
7李德志,陶青川,黄凤英.远距离视觉测量中的快速靶标提取与解码方法[J].现代计算机,2016,0(2):63-67.
8肖茜,鲁宏伟.基于高斯平滑的自适应角点检测[J].计算机辅助设计与图形学学报,2003,15(11):1358-1361. 被引量：24
9林艳,朱建军.基于语义相似度的海量遥感图像可视化研究[J].测绘科学,2009,34(6):40-42.
10Miranda将在BIRTV突出展示其最新的3Gbps／HD／SD产品[J].世界广播电视,2009,23(8):18-18.

电子学报

2006年第B12期

浏览历史

内容加载中请稍等...

基于Gabor滤波器的数字文档图像文字提取算法被引量：4

参考文献14

同被引文献33

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Gabor滤波器的数字文档图像文字提取算法 被引量：4

参考文献14

同被引文献33

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Gabor滤波器的数字文档图像文字提取算法被引量：4