结合区域颜色一致性和图割的复杂场景文本分割方法被引量：1

Complex scene text segmentation method using region color consistence and graph cut

导出

摘要针对复杂场景文本难以有效分割的问题,提出一种复杂场景文本分割方法.首先,使用简单的线性迭代聚类(SLIC)算法将原始图像分割为若干局部区域,并在其区域邻接图上构建图割模型;然后,采用高斯混合模型(GMMs)和支持向量机(SVM)后验概率模型对场景文本进行建模,并引入每个局部区域与模型之间的匹配度用于计算似然能.为了增强GMMs的鉴别力,在参数学习中引入模型性能描述子,自适应地获得模型参数.实验结果表明,所提出的算法能够较好地处理复杂场景文本分割问题,文本的识别率得到了明显的提升. To solve the problem of text segmentation in complex scene images, a method of complex scene text segmentation is proposed. The original image is firstly divided into some small homogeneous regions by using the simple linear iterative clustering（SLIC） algorithm, and the graph model is constructed based on the region neighborhood connection diagram.Then, Gaussian mixture models（GMMs） and support vector machine（SVM） post probability based model are proposed to make model for foreground（text）, and the degree of each region＇s fitness to models is introduced to calculate likelihood energy. In addition, to improve the discrimination ability of GMMs, a model performance descriptor is introduced to estimate parameters of GMMs adaptively. Experimental results show that the proposed method can deal with the problem of complex scene text segmentation efficiently, and the recognition precision rate is improved significantly.

作者刘晓佩

机构地区西安科技大学通信与信息工程学院西安电子科技大学通信工程学院

出处《控制与决策》 EI CSCD 北大核心 2015年第11期1987-1992,共6页 Control and Decision

基金国家自然科学基金项目(61302133) 陕西省科技研究计划工业攻关项目(2014K06-37 2013K07-35 2015GY023)

关键词文档分析场景文本文本分割图割 document analysis scene text text segmentation graph cut

分类号 TP393.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1Sharma N, Pal U, Blumenstein M. Recent advances in video based document processing: A review[C]. Proc of the 10th IAPR Int Workshop on Document Analysis Systems. Queenslands: IEEE Press, 2012: 63-68.
2Zhang H G, Zhao K L, Song Y Z, et al. Text extraction from natural scene image: A survey[J]. Neurocomputing, 2013, 122: 310-323.
3姜维,卢朝阳,李静,刘晓佩,姚超.基于视觉显著性和提升框架的场景文字背景抑制方法[J].电子与信息学报,2014,36(3):617-623. 被引量：3
4Boykov Y, Funka-Lea G. Graph cuts and efficient N-D image segmentation[J]. Int J of Computer Vision, 2006, 70(2): 109-131.
5刘松涛,殷福亮.基于图割的图像分割方法及其新进展[J].自动化学报,2012,38(6):911-922. 被引量：142
6Shi C, Xiao B, Wang C, et al. Adaptive graph cut based binarization of video text images[C]. The 10th IAPR Int Workshop on Document Analysis Systems. Queenslands: IEEE Press, 2012: 58-62.
7Mishra A, Alahari K, Jawahar C V. An MRF model for binarization of natural scene text[C]. Proc of the 1 lth Int Conf on Document Analysis and Recognition. Beijing: IEEE Press, 2011: 11-16.
8徐胜军,韩九强,刘光辉,刘欣.基于局部空间自适应MRF模型的图像分割[J].控制与决策,2013,28(6):889-893. 被引量：5
9韩守东,赵勇,陶文兵,桑农.基于高斯超像素的快速Graph Cuts图像分割方法[J].自动化学报,2011,37(1):11-20. 被引量：56
10Aehanta R, Shaji A, Smith K, et al. SLIC superpixels compared to state-of-the-art superpixel methods[J]. IEEE Trans on PAMI, 2012, 34(11): 2274-2282.

二级参考文献113

1唐鹏,高琳,盛鹏.基于动态形状的红外目标提取算法[J].光电子．激光,2009,20(8):1049-1052. 被引量：3
2闫成新,桑农,张天序.基于图论的图像分割研究进展[J].计算机工程与应用,2006,42(5):11-14. 被引量：33
3陶文兵,金海.一种新的基于图谱理论的图像阈值分割方法[J].计算机学报,2007,30(1):110-119. 被引量：58
4Boykov Y, Funka-Lea G. Graph cuts and efficient N-D image segmentation. International Journal of Computer Vision, 2006, 70(2): 109-131.
5Han S D, Tao W B, Wang D S, Tai X C, Wu X L. Image segmentation based on grabcut framework integrating multiscale nonlinear structure tensor. IEEE Transactions on Image Processing, 2009, 18(10): 2289-2302.
6Delong A, Boykov Y. A scalable graph-cut algorithm for N-D grids. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, USA: IEEE, 2008. 1-8.
7Han S D, Tao W B, Wu X L, Tai X C, Wang T J. Fast image segmentation based on multilevel banded closed-form method. Pattern Recognition Letters, 2010, 31(3): 216-225.
8Li Y, Sun J, Tang C K, Shum H Y. Lazy snapping. ACM Transactions on Graphics, 2004, 23(3): 303--308.
9Comaniciu D, Meer P. Mean shift: a robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603-619.
10Christoudias C M, Georgescu B, Meer P. Synergism in low level vision. In: Proceedings of the 16th International Conference on Pattern Recognition. Washington D.C., USA: IEEE, 2002. 150-155.

共引文献196

1赵挺.基于两阶段区域生长法的肝内血管分割算法分析[J].医学信息,2017,30(2):276-277. 被引量：1
2王倩,张桦,徐光平,薛彦兵.结合均值漂移与最小生成树的图像分割算法[J].光电子．激光,2012,23(3):588-594.
3林丽莉,周文晖.多蚁群动态协作优化的道路图像分割算法[J].中国图象图形学报,2012,17(4):553-559. 被引量：3
4黄杰,杨孝平.基于凸松弛方法的医学B超图像快速分割[J].自动化学报,2012,38(4):582-590. 被引量：3
5张浩峰,业巧林,赵春霞,杨静宇.一种非监督道路场景分割方法[J].南京理工大学学报,2012,36(2):232-237. 被引量：2
6张长青,葛文英,刘国英.一种基于区域分级合并的彩色图像分割方法[J].计算机工程与应用,2012,48(17):203-206. 被引量：5
7刘松涛,殷福亮.基于图割的图像分割方法及其新进展[J].自动化学报,2012,38(6):911-922. 被引量：142
8刘芳,代钦,石祥滨,刘进立.基于超像素的快速MRF红外行人图像分割算法[J].计算机仿真,2012,29(10):26-29. 被引量：4
9刘松涛,王慧丽,殷福亮.基于图割和模糊连接度的交互式舰船红外图像分割方法[J].自动化学报,2012,38(11):1735-1750. 被引量：10
10张奇志,周亚丽.基于kinect的物体抓取场景认知[J].北京信息科技大学学报（自然科学版）,2012,27(5):11-16. 被引量：2

同被引文献4

1彭浩,陈继锋,刘琼,王海涛,高海波.一种面向聚焦爬虫的自然场景文本定位技术[J].小型微型计算机系统,2014,35(9):2014-2018. 被引量：4
2李峰,黄金柱,李舟军,杨伟铭.使用关键词扩展的新闻文本自动摘要方法[J].计算机科学与探索,2016,10(3):372-380. 被引量：14
3杨玲玲,叶东毅.一种基于图像矩和纹理特征的自然场景文本检测算法[J].小型微型计算机系统,2016,37(6):1313-1317. 被引量：2
4易尧华,申春辉,刘菊华,卢利琼.结合MSCRs与MSERs的自然场景文本检测[J].中国图象图形学报,2017,22(2):154-160. 被引量：18

引证文献1

1董引娣,赵晓祎.文本线局部极值区域两阶段场景文本序列识别[J].计算机科学与探索,2018,12(8):1323-1330. 被引量：1

二级引证文献1

1徐一鸣,潘伟民.基于深度学习的多重文档结构识别方法研究[J].电子设计工程,2021,29(21):53-56. 被引量：1

1吴会松.试论软件文档的用户界面及设计[J].邵阳高专学报,1997,10(1):12-15.
2赵志成.基于Android手机平台的来电通设计[J].哈尔滨师范大学自然科学学报,2014,30(6):72-74.
3吴会松.试论软件文档的用户界面及设计[J].电子工程师,1997,0(3):12-16.
4崔兆顺,韩双旺.利用VB实现文档分析[J].甘肃联合大学学报（自然科学版）,2004,18(3):32-34.
5吴会松,陈润生.试论软件文档的用户界面及设计[J].宁夏工学院学报（自然科学版）,1997,9(2):24-28.
6胡颖.抄袭检测技术[J].内江科技,2010,31(12):117-118. 被引量：1
7吴会松,杜希松.软件文档的用户界面及设计[J].山东建筑工程学院学报,1997,12(3):95-99.
8黄金凤,曾凌静.Office文档分析和自动阅卷系统的设计与分析[J].莆田学院学报,2011,18(5):77-81. 被引量：2
9何云升,郑小宁.XML文档分析研究[J].电子科技,2001,14(19):27-29.
10蔡爱平,夏阳.一种基于后验概率的分类器融合方法[J].硅谷,2010,3(4):66-66.

控制与决策

2015年第11期

浏览历史

内容加载中请稍等...

结合区域颜色一致性和图割的复杂场景文本分割方法被引量：1

参考文献16

二级参考文献113

共引文献196

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

结合区域颜色一致性和图割的复杂场景文本分割方法 被引量：1

参考文献16

二级参考文献113

共引文献196

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

结合区域颜色一致性和图割的复杂场景文本分割方法被引量：1