自然场景图像中基于视觉显著性的文本区域检测被引量：3

Visual Saliency-Based Detection of Text Region in Natural Scene Images

下载PDF

导出

摘要从自然场景图像中抽取文本信息有利于场景图像的内容分析.文中根据图像中文本通常在局部区域具有显著性的特点,提出多尺度包围盒视觉显著性模型,并利用该模型设计一种可以融合边缘和纹理信息的候选文本检测方法.首先在Lab颜色空间构造基于边缘和纹理信息的图像同质性,并利用它将图像映射到同质性空间;然后根据多尺度包围盒视觉显著性模型求Lab颜色空间的同质性均值图像;最后求同质映射图像与同质性均值图像的加权欧氏距离,将其作为显著性度量,以提取文本区域.自然场景图像的实验表明:与单纯利用边缘检测或同质性映射进行文本检测的方法相比,文中提出的方法能够更好地抑制背景的干扰,这有利于进一步将文本区域与背景剥离,进行更精确的文本定位. Extracting text information from images captured in natural scenes is helpful for the content analysis of images. In this paper, according to the fact that the texts in images is often salient in local regions, a novel visual saliency model with multi-scale bounding box is proposed, based on which a new method combining the edge and texture information is designed for the candidate text detection. In this method, first, Lab color space is used to construct the edge and textural information-based image homogeneity, and by using this characteristic, the image is mapped into the homogeneity domain. Then, the proposed model is employed to generate average homogeneity ima- ges. Finally, the weighted Euclidean distance between the homogeneity image and the average homogeneity image is determined, and is taken as the saliency measure to extract text regions. Experimental results of natural scene images show that, as compared with the text detection methods based on the edge or the homogeneity, the proposed method can better restrain the background noise, which helps to further segment the text regions from the back- ground and achieve more accurate text location.

作者闵华清郑华强罗荣华

机构地区华南理工大学计算机科学与工程学院

出处《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2012年第8期39-45,共7页 Journal of South China University of Technology(Natural Science Edition)

基金国家自然科学基金资助项目(61005061 60873078) 广东省自然科学基金资助项目(9251064101000010) 广东省科技攻关项目(2010B050400006 2010B010600016) 华南理工大学中央高校基本科研业务费专项资金资助项目(2012ZZ0067)

关键词文本检测视觉显著性同质性图像分割 text detection visual saliency homogeneity image segmentation

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1Mariano V Y, Kasturi R. Locating uniform-colored text in video frames [ C ] //Proceedings of 15th International Conference on Pattern Recognition. Barcelona: IEEE ,2000 : 539-542.
2蒋人杰,戚飞虎,徐立,吴国荣.基于连通分量特征的文本检测与分割[J].中国图象图形学报,2006,11(11):1653-1656. 被引量：9
3Lienhart Rainer,Wemicke Axel. Localizing and segmenta- tion text in images and videos [ J ]. IEEE Trans on Cir- cuits and Systems for Video Technology, 2002,12 ( 4 ) : 256-268.
4Chen D, Odobez J M, Bourlard H. Text detection and re- cognition in images and video frames [ J ]. Pattern Recog- nition, 2004,37 ( 3 ) : 595- 608.
5Kim K I, Jung K, Kim J H. Texture-based approach for text detection in images using support vector machines and continuously adaptive mean shift algorithm [J]. IEEE Transactions on Pattern Analysis and Machine Intelli- gence, 2003,25 ( 12 ) : 1631 - 1639.
6Zhong Y, Zhang H, Jain A K. Automatic caption localiza- tion in compressed video [ J ]. IEEE Transactions on Pa- ttern Analysis and Machine Intelligence, 2000,22 ( 4 ) :385-392.
7Epshtein B, Ofek E, Wexler Y. Detecting text in natural scenes with stroke width transform [ C ]//Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition. San Franciseo : IEEE, 2010 : 2963- 2970.
8张引,潘云鹤.复杂背景下文本提取的彩色边缘检测算子设计[J].软件学报,2001,12(8):1129-1135. 被引量：20
9黄剑华,承恒达,吴锐,刘家锋.基于模糊同质性映射的文本检测方法[J].电子与信息学报,2008,30(6):1376-1380. 被引量：5
10Itti L, Koch C, Niebur E. A model of saliency-based visual attention for rapid scene analysis [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998,20 (11) :1254-1259.

二级参考文献24

1孟章荣.各种颜色模型选用需求分析[J].中国图象图形学报（A辑）,1996,1(3):238-241. 被引量：20
2庄越挺.智能多媒体信息分析与检索的研究：博士学位论文[M].杭州:浙江大学,1998..
3Clark P,Mirmehdi M.Finding text regions using localized measures[A].In:Proceedings of 11th British Machine Vision Conference[C].Bristol,UK,2000:675 ～ 684.
4Chun B T,Bae Y,Kim T Y.Automatic text extraction in digital videos using FFT and neural network[A].In:Proceedings of IEEE International Fuzzy Systems Conference[C],Seoul,Korea,1999,2:1112 ～1115.
5Chen D,Shearer K,Bourlard H.Text enhancement with asymmetric alter for video OCR[A].In:Proceedings of International Conference on Image Analysis and Recognition[C],Venice,Italy,2001:192 ～ 197.
6Mao W,Chung F,Lanm K,et al.Hybrid Chinese/English text detection in images and video frames[A].In:Proceedings of International Conference on Pattern Recognition[C],Quebec,Canada,2002,3:1015 ～ 1018.
7Wang K Q,Kangas J A.Character location in scene images from digital camera[J].Pattern Recognition,2003,36 (10):2287 ～2299.
8Kim K C,Byun H R,Song Y J,et al.Scene text extraction in natural scene images using hierarchical feature combining and verification[A].In:Proceedings of International Conference on Pattern Recognition[C],Cambridge,UK,2004,2:679 ～ 682.
9Zhu K,Qi F,Jiang R,et al.Using adaboost to detect and segment characters from natural scenes[A].In:Proceedings of Camera Based Document Analysis and Recognition[C],Seoul,Korea,2005:52 ～ 59.
10Winger L,Robinson J A,Jernigan M E.Low-complexity character extraction in low-contrast scene images[J].International Journal of Pattern Recognition and Artificial Intelligence,2000,14(2):113 ～135.

共引文献31

1闻京,张凌,袁华.一种复杂背景图像中文字区域提取算法[J].中山大学学报（自然科学版）,2008,47(z1):5-10. 被引量：1
2彭媛,周军.一种基于线条分类的视频文字检测算法[J].电视技术,2009,33(S1):136-138.
3张佑生,汪荣贵,胡敏.基于模糊技术的文本检测提取方法研究[J].合肥工业大学学报（自然科学版）,2005,28(9):1073-1080.
4胡楠,王英武,吕凝.基于内容的视频多模式检索方法[J].吉林大学学报（信息科学版）,2006,24(3):265-270. 被引量：1
5许洋洋,袁华.一种基于内容的广告垃圾图像过滤方法[J].山东大学学报（理学版）,2006,41(3):73-78. 被引量：9
6刘思远,李晓峰,李在铭.基于邻域彩色变化矢量场的图像边缘检测技术研究[J].计算机应用研究,2007,24(7):289-291. 被引量：4
7袁海东,马华东,黄晓冬.基于梯度与粗糙度的视频文本检测与定位[J].电子学报,2008,36(8):1660-1664. 被引量：9
8万明成,耿技,程红蓉,曾志华.垃圾邮件图像中的文字角点检测[J].计算机工程与应用,2009,45(14):170-172.
9程红蓉,秦志光,万明成,王灿,靳京,傅翀.图像垃圾邮件中文本区域的自动提取方法[J].解放军理工大学学报（自然科学版）,2009,10(3):258-261. 被引量：1
10潘道远,宋顺林.基于多方法融合的文本定位算法的研究[J].计算机应用与软件,2010,27(6):236-238. 被引量：4

同被引文献20

1王琪,王丽萍,陈凯迪.一种简单的图案填充算法[J].微计算机信息,2005,21(09X):116-117. 被引量：18
2晋瑾,平西建,张涛,陈明贵.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11. 被引量：17
3周开军,陈三宝,徐江陵.复杂背景下的车牌定位和字符分割研究[J].计算机工程,2007,33(4):198-200. 被引量：27
4周芳芳,樊晓平,叶榛.均值漂移算法的研究与应用[J].控制与决策,2007,22(8):841-847. 被引量：59
5孙玉宝,肖亮,韦志辉,邵文泽.基于Gabor感知多成份字典的图像稀疏表示算法研究[J].自动化学报,2008,34(11):1379-1387. 被引量：43
6石光明,刘丹华,高大化,刘哲,林杰,王良君.压缩感知理论及其研究进展[J].电子学报,2009,37(5):1070-1081. 被引量：706
7汤杨,潘志庚,汤敏,王平安,夏德深.基于分级mean shift的图像分割算法[J].计算机研究与发展,2009,46(9):1424-1431. 被引量：12
8李树涛,魏丹.压缩传感综述[J].自动化学报,2009,35(11):1369-1377. 被引量：201
9徐健,常志国.基于聚类的自适应图像稀疏表示算法及其应用[J].光子学报,2011,40(2):316-320. 被引量：16
10张昕,孙富春.Pulse Coupled Neural Network Edge-Based Algorithm for Image Text Locating[J].Tsinghua Science and Technology,2011,16(1):22-30. 被引量：5

引证文献3

1付芦静,钱军浩,钟云飞.基于汉字连通分量的印刷图像版面分割方法[J].计算机工程与应用,2015,51(5):178-182. 被引量：3
2崔男,李婧,孙艳蕊.基于数学形态学的渐变色字符定位算法[J].计算机与数字工程,2016,44(10):2011-2014. 被引量：1
3祝勇俊,刘文波,沈骞,徐梦莹.基于显著性的自适应分块压缩感知算法[J].电光与控制,2019,26(12):28-33. 被引量：3

二级引证文献7

1黄毅晟.基于移动端图像识别的题库采集模型实践研究[J].中国信息技术教育,2016(12):75-78. 被引量：1
2葛怀东,尚弘.古籍书影中钤印提取技术的探讨[J].计算机应用与软件,2017,34(5):189-194. 被引量：3
3覃正优,伍永.基于图像超分辨率的车牌识别研究[J].现代计算机（中旬刊）,2017(8):59-62.
4辛明远,梅劲松,蒋银男.基于小波分解的客运列车车号定位及阈值分割[J].计算机与数字工程,2019,47(1):221-225. 被引量：1
5王艳,李煜,赵洪山,王龄婕,赵一宇.配电设备监测信号的压缩感知与设备异常识别[J].高电压技术,2022,48(1):11-19. 被引量：12
6刘文韬,李华.一种显著性检测及其自适应传输控制算法研究[J].信息技术,2022,46(12):189-194.
7侯保军,田金鹏,张紫沁.基于Swin Transformer的图像压缩感知重构[J].电光与控制,2023,30(11):94-99.

1王一刚,蒋刚毅,郁梅,彭宗举,范胜利,邵枫.基于类高斯模型的显微图像固点噪声定位算法[J].光电工程,2011,38(11):106-112.
2李小林,齐丽英.一种融合边缘和区域特征的主动轮廓图像分割[J].安康学院学报,2008,20(2):91-92.
3王晓阳,彭真明,张萍,孟晔铭.局部对比度结合区域显著性红外弱小目标检测[J].强激光与粒子束,2015,27(9):32-38. 被引量：19
4樊强,齐春.基于全局和局部短期稀疏表示的显著性检测[J].计算机科学,2014,41(10):80-83. 被引量：2
5古晶.RGB到Lab颜色空间转换[J].广东印刷,2009(5):11-14. 被引量：10
6张微.融合边缘和形状先验的MRF目标分割[J].重庆理工大学学报（自然科学）,2014,28(10):79-85. 被引量：2
7王江涛,石红岩,练煜.基于Relieft特征加权的C均值聚类算法的研究和改进[J].合肥学院学报（自然科学版）,2015,25(2):29-34.
8Riverbed SteelFusion延伸至云环境[J].数字通信世界,2016,0(3):13-13.
9谭伟.图片处理中常用颜色模式分析[J].印刷技术,2006(22):51-52.
10邹强,蒋平,周进,卢泽琼.基于图像边缘和对比度的显著目标检测[J].科学技术与工程,2013,21(34):10193-10197. 被引量：2

华南理工大学学报（自然科学版）

2012年第8期

浏览历史

内容加载中请稍等...

自然场景图像中基于视觉显著性的文本区域检测被引量：3

参考文献16

二级参考文献24

共引文献31

同被引文献20

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

自然场景图像中基于视觉显著性的文本区域检测 被引量：3

参考文献16

二级参考文献24

共引文献31

同被引文献20

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

自然场景图像中基于视觉显著性的文本区域检测被引量：3