一种基于内容的文档图像检索方法被引量：8

A Content-Based Algorithm for Document Image Retrieval

下载PDF

导出

摘要使用一个图像作为查询检索输入,根据该图像的版面分析特征、统计特征、纹理特征与数据库中图像的相似程度检索图像.该检索方法首先利用数学形态学对文档图像进行段落分割和行分割,作为文档图像的版面结构特征;然后根据图像的统计特征包括字符数、统计数特征、纹理特征给出文档图像抽取算法;最后给出检索算法模型.实验结果表明,本算法具有较好的查准率和查全率,在基于内容的文档图像检索中具有应用价值. This paper studies the content-based image retrieval for document image.Given a query image,the system returns overall similar images by layout analysis and statistic feature in image database.First,segment an image into paragraphs and lines based on mathematical morphology,return the image layout analysis results;and then compute the image statistic feature include characters, statistic count feature and texture to give distil arithmetic of the document image.In the end,we describe the matching model.This algorithm is tested through trials and errors.The experiment results indicate this algorithm is good at precision and recall.This algorithm is highly valuable in document image retrieval.

作者宋涛刘刚

机构地区河南大学计算机与信息工程学院河南省招生办公室

出处《郑州大学学报（工学版）》 CAS 北大核心 2010年第1期120-124,共5页 Journal of Zhengzhou University（Engineering Science）

关键词基于内容的图像检索版面分析文档图像数学形态学图像分割图像特征 CBIR layout analysis document image mathematical morphology image segmentation image feature

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1LUO J, MARIO A N. Content based sub - image retrieval via hierarchical tree matching [ C ]. ACM - MMDB,2003. 63 - 69.
2MANOUVIER M, RUKOZ M, JOMIER G. A generalized metric distance between hierarchically partitioned images [ C ]. MDM/KDD ' 05 August 21,2005, Chicago USA. 33 -41.
3丘衍航.基于GMEM聚类的EMD图像检索[C].第十三届全国图象图形学学术会议,2006.575-579.
4CARSON C, THOMAS M, BELONGIE S, et al. A system for region - based image indexing and retrieval [C]. In Proc. of 3rd Intl. Conf. on Visnal Information Systems, 1999. 509 -516.
5LI J, WANG J Z, WIEDERHOLD G. IRM: Intergrated Region Matching for Image Retrieval[ C]. in Proc. of ACM Intl. Conf. on Multimedia, 2000. 147-156.
6VALTTERI T, TIMO A, MATTI P. Block -based methods for image retrieval using local binary patterns [J]. SCIA2005, 882 -891.
7金磊,陈优广,严敏.一种基于用户感兴趣区域的图像检索算法[J].计算机技术与发展,2006,16(3):104-106. 被引量：2
8丁玉霞,程义民,李杰,王以孝.一种基于目标区域的图像检索方法[J].计算机工程与应用,2006,42(17):69-72. 被引量：8
9MAW Y, ZHANG HJ. Bench marking of image features for content - based retrieval [ C ]. California, USA: The Thirty -Second Asilomar Conference on Signals, 1998. 253 - 257.
10贺玲,吴玲达,蔡益朝.一种面向大规模图像库的降维索引新方法[J].计算机工程,2006,32(22):20-22. 被引量：4

二级参考文献20

1Malki J, Boujemaa N, Nastar C, et al. Region Queries without Segmentation for Image Retrieval by Content[A]. Proceedings of the Third International Conference on Visual Information and Information Systems[ C]. London, UK:Spfinger- Verlag,1999.115 - 122.
2Rui Y, Huang T S, Mehrotra S, et al. Relevance feedback: A Power tool for interactive content - based image retrieval[ J ].IEEE Transactions on Circuits and Systems for Video Technology, 1998,8 (5):644 - 655.
3Su Zhong,Zhang Hongjiang,Li S, et al. Relevance Feedback in Content- Based Image Retrieval: Bayesian Framework, Feature Subspaces, and Progressive Leaming[J]. IEEE Trarsactions on Image Processing,2003,12(8) :924 - 936.
4Manjunath B S, Ma W Y. Texture Features for Browsing and Retrieval of Image Data [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1996,18(8) :837 - 842.
5Jianping Fan,David K Y Yau.Automatic Image Segmentation by Integrating Color-Edge Extraction and Seeded Region Growing[J].IEEE Trans Image Processing,2001; 10(10):1454～1466.
6John Canny.A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986;PA MI-8 (6):679～698.
7K R Castlemanl Digital Image Processing[M].Prentice Hall,Inc,1996-01.
8Maeda J.Segmentation of natural images using anisotropic diffusion and linking of boundary edges[J].Pattern Recognition,1998; 31 (12):1993～1999.
9Tremeau A,Colantoni P.Regions adjacency graph applied to color image segmentation[J].IEEE Trans Image Processing,2000;9(4):735～744.
10Feng J,Mingjing L et al.An efficient and effective region-based image retrieval framework[J].IEEE Trans Image Processing,2004; 13(5):699～709.

共引文献11

1宋怀波,何东健.面向精细农业的高维数据本征维数估计方法研究进展[J].中国科学：信息科学,2010,40(S1):104-110. 被引量：5
2朱小波,杨玲,关忠仁.基于牙科PACS系统的信息检索技术研究[J].西南民族大学学报（自然科学版）,2007,33(4):976-979. 被引量：1
3李杰,程义民,葛仕明,张玲.结合流形排序和区域匹配的图像检索[J].小型微型计算机系统,2008,29(3):511-515. 被引量：3
4张缨,汪栋,叶玉坤,高阳,赵波,朱亮,郭晓文.计算机辅助肺癌细胞病理诊断的初步研究[J].临床肿瘤学杂志,2008,13(7):611-614. 被引量：2
5卢海彦,程义民,何兵兵,张玲.基于自适应阈值的视频文本检测方法[J].计算机仿真,2008,25(9):204-207. 被引量：1
6张敏霞,陈丽.图像检索中一种新的目标区域提取算法[J].机电工程,2009,26(2):56-58.
7侯阿临,张志芳,周鹏,王楠,王明明.MPEG-7视觉区域形状描述子的商标图像检索[J].现代电子技术,2009,32(8):84-86.
8欧阳彝华,黄芳,周敏.基于灰度直方图的心脏图像检索[J].计算机技术与发展,2009,19(9):125-127. 被引量：2
9梁竞敏.低层特征获取高层语义的图像检索[J].计算机工程与应用,2010,46(32):188-191.
10梁竞敏.Adaboost和信息瓶颈算法在图像检索中的应用[J].计算机工程与应用,2010,46(35):215-218. 被引量：1

同被引文献55

1薛万宇,宋余庆,王恒,高军.一种医学图像数据库存储方案设计与实现[J].微计算机信息,2008,24(3):177-179. 被引量：9
2徐润泽.“意象”概念在中国艺术语境中的出现和变迁浅析[J].新视觉艺术,2014(1):27-28. 被引量：2
3赵吉宾,,刘伟军,,王越超,.快速成型切片数据的优化算法研究[J].小型微型计算机系统,2004,25(10):1818-1821. 被引量：8
4万毅荣,蒙应杰,赵雅洁,陈伟民.敦煌学数字图书馆中数字图像的处理及存储[J].情报科学,2005,23(8):1229-1232. 被引量：7
5宋辉,李弼程.一种使用Harris特征点的区域图像检索算法[J].计算机工程,2006,32(7):202-203. 被引量：6
6胡芝兰,林行刚,严洪.基于分层密度特征的文档图像检索[J].清华大学学报（自然科学版）,2006,46(7):1231-1234. 被引量：6
7刘涛,张艳宁,孙瑾秋.一种基于目标区域的图像检索方法[J].计算机工程与应用,2006,42(26):68-70. 被引量：1
8熊回香.数字图书馆中的数字图像处理技术[J].情报杂志,2006,25(9):28-30. 被引量：7
9王永茂,刘贺平.强噪声车牌图像中的字符识别[J].计算机仿真,2006,23(12):244-246. 被引量：12
10付旻,黄祥林,高芸.文档图像分割技术研究[J].中国传媒大学学报（自然科学版）,2006,13(4):62-67. 被引量：4

引证文献8

1吴建波,赵建民,朱信忠,徐慧英.基于一种SIFT优化算法的图像检索[J].微型电脑应用,2011(5):4-7. 被引量：6
2王睿,李斌.基于形状上下文识别算法的车牌识别研究[J].计算机仿真,2011,28(11):343-345. 被引量：4
3杨利清.公共图书馆发展模式研究[J].图书馆学刊,2012,34(8):5-7. 被引量：1
4荆永菊.基于纹理特征的数字图书馆文档图像识别[J].图书馆学刊,2012,34(8):97-98.
5刘凌霞,牛红惠.基于两级阈值的图像分割技术在文档图像中的应用[J].计算机应用与软件,2012,29(9):246-248. 被引量：2
6张晋霞,王燕玲.基于AForge.NET医疗影像分析系统[J].福建电脑,2012,28(10):28-29. 被引量：1
7徐一男,李禾.基于艺术语义特征抽取的艺术档案信息聚合初探[J].图书情报导刊,2017,2(4):52-56. 被引量：2
8王牡丹,邬春学.基于文本布局块距离度量的文档图像检索[J].电子科技,2017,30(9):46-49.

二级引证文献16

1范亚东.数字艺术档案建构的若干要素[J].浙江档案,2021(2):60-61. 被引量：3
2刘智慧,周媛,苗耀锋.即插即用的分布式云端视频处理系统[J].制造业自动化,2012,34(12):72-75. 被引量：1
3史露,苏刚,韩飞.基于SIFT和SURF图像拼接算法的改进算法[J].计算机应用与软件,2013,30(6):72-74. 被引量：28
4张会敏,谢泽奇,张云龙.车牌识别系统中的关键技术研究[J].科学技术与工程,2013,21(36):10957-10961. 被引量：2
5张静,华顺刚.基于SIFT相似性度量的图像缩放[J].计算机工程,2014,40(2):219-223. 被引量：2
6王祥玲,王蒙军,周亚同.车牌字符的类欧几里得距离特征提取与分析[J].计算机仿真,2014,31(4):184-187. 被引量：4
7翟军辉,薛天宇.提取医学图像局部特征的方法与实现[J].计算机光盘软件与应用,2014,17(4):76-79.
8盛亚光.乡镇公共文化服务体系建设与发展刍论[J].图书馆学刊,2014,36(4):18-18.
9邓富强.特定区域数字识别系统的实现[J].电子技术与软件工程,2015(15):103-103. 被引量：1
10董晓峰,顾晓文,王业,朱国防.电网倒闸操作票智能监护系统设计[J].中国电力,2015,48(12):16-22. 被引量：12

1刘劼.数字图书馆中的文档图像检索技术概述[J].科技创新导报,2009,6(15):193-193.
2李庆敏,王宪国.计数问题可分类[J].数学大世界（初中版）,2009(7):19-20.
3去年全国财政收入执行初步统计数为61316．9亿元[J].上海地方交通,2009(1):42-42.
4南非村长.美化Excel折线图表[J].电脑爱好者,2017,0(1):44-45.
5张田,王希常,尘昌华.基于特征的文档图像检索[J].计算机工程,2009,35(22):176-178. 被引量：2
6IBM占中国商用计算机市场份额达到43．6％[J].计算机系统应用,2004,13(10):80-80.
72011年《测井技术》稿件刊用统计[J].测井技术,2011,35(6):558-558.
8王颖.用DBASE—III语言汇总统计数的一种方法[J].软件开发与应用,1993(3):40-41.
9赵慧,王希常,刘江.一种基于版面结构距离的文档图像检索算法[J].微型机与应用,2010,29(21):42-44. 被引量：1
10马磊,刘江.基于纹理谱描述子的文档图像检索算法[J].计算机应用,2010,30(11):2980-2982. 被引量：3

郑州大学学报（工学版）

2010年第1期

浏览历史

内容加载中请稍等...

一种基于内容的文档图像检索方法被引量：8

参考文献11

二级参考文献20

共引文献11

同被引文献55

引证文献8

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

一种基于内容的文档图像检索方法 被引量：8

参考文献11

二级参考文献20

共引文献11

同被引文献55

引证文献8

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

一种基于内容的文档图像检索方法被引量：8