面向复杂场景图像的文本定位新方法被引量：3

A Novel Text Location Method for Complex Scene Pictures

下载PDF

导出

摘要针对复杂场景文本,提出了通过投影产生候选文本块的新算法和针对该算法的候选文本块分析方法。首先根据MLP网络的输出确定图像每个像素点是文本像素点还是非文本像素点,得到候选二值图像。然后根据候选二值图像使用投影法生成候选文本块,针对该投影法,本文提出了频率分析法剔除非文本块,有效的提高了定位准确率。实验表明,本文的方法实现简单,而且可以得到较好的文本定位效果。 This paper proposes a novel candidate text-block generating algorithm using projection for complex scene text and a novel method for that algorithm. First, text-pixels and nontext-pixels are discriminated based on the output of MLPs, and a candidate binary image is got. Then, based on candidate binary image, candidate text-blocks are generated using projection algorithm. We propose the frequency analysis method for projection algorithm to eliminate non-text blocks, that method increases location precision effectively. Experimental results show that, our approach is simple to implement and can get good text location result.

作者傅光辉黄剑华唐降龙刘家锋吴锐

机构地区哈尔滨工业大学计算机学院

出处《微计算机信息》北大核心 2008年第18期183-185,共3页 Control & Automation

基金国家自然科学基金(60672090/F010204)

关键词 MLP网络多层感知器投影区域分析 MLP Network Multi-layer Perception Projection Region Analysis

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Bin Wang,Xiang Feng Li, Feng Liu et al.. Color text image binarization based on binary texture analysis[J] Pattern Recognition Letters 26(2005):1568-1576.
2张引,潘云鹤.面向彩色图像和视频的文本提取新方法[J].计算机辅助设计与图形学学报,2002,14(1):36-40. 被引量：14
3Chen Xiangrong, Yuille A L. Detecting and Reading Text in Natural Scenes [C]. Proceedings of the IEEE Computer Society Conference,2004:366-373.
4Rainer Lienhart, Axel Wernicke. Localizing and segmenting text in images and videos [J]IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY,2002.12,4:256-268.
5王艳春,李建军,何鹏,尹明.公路交通管理中行驶车辆自动识别技术研究[J].微计算机信息,2006(01Z):193-195. 被引量：13
6N.Otsu. A threshold Selection method from gray-level histogram [J]IEEE Trans systems Man and Cybernet.1979.9,1:62-66.
7Simon M. Lucas, A Panaretos, L Sosa et al.. ICDAR 2003 Robust Reading Competitions [A]. 7th International Conference on Document Analysis and Recognition (ICDAR 2003)[C].2003.2:682-687.

二级参考文献6

1张莹,朱军.自动车辆识别系统的设计与实现[J].微计算机信息,2005,21(10S):145-147. 被引量：3
2吴敏金.图像形态学[M].上海:上海科学技术文献出版社,1991..
3Shao Yi Chien,Shyh Yih Ma,Liang Gee Chen.Efficient Moving Object Segmentation Algorithm Using Background Registration Technique[J].IEEE Trans Circuits and Systems for Video Technology,2002:12(7):577-586.
4S.H.Park,K.Ikim,K.Jung,H.J.Kim.Location Car License Plate Using Neural Networks Electronics Letters,1999,17:1475-1477
5魏武,张起森,王明俊,黄中祥.一种基于模板匹配的车牌识别方法[J].中国公路学报,2001,14(1):104-106. 被引量：42
6林立,何为,韩力群.汽车牌照自动识别技术的现状与发展[J].北京轻工业学院学报,2001,19(1):36-40. 被引量：12

共引文献25

1李青,郑南宁,游屈波,宋永红.计算机图形分离算法研究及实现[J].计算机辅助设计与图形学学报,2004,16(8):1040-1044. 被引量：4
2章东平,祝金标,刘济林.自动定位彩色图像中的文本[J].浙江大学学报（工学版）,2005,39(2):229-233. 被引量：5
3季丽琴,王加俊.视频图像内文字的自动提取新方法[J].苏州大学学报（自然科学版）,2006,22(2):43-47. 被引量：5
4李雪妍,郭树旭,郜峰利.基于小波模极大值的视频文本区域的提取[J].计算机工程,2007,33(5):26-28. 被引量：4
5虞耀君,吴德会.一种车牌图像校正新方法[J].微计算机信息,2007,23(05X):310-312. 被引量：3
6邓长春.智能路况识别分析系统设计[J].微计算机信息,2007(26):279-281. 被引量：2
7季丽琴,王加俊.视频字幕的自动检测与去除[J].中国图象图形学报,2008,13(3):461-466. 被引量：6
8胡会珍,黄晋英.基于Vc++的车辆运动中的实时图像处理[J].仪器仪表用户,2008,15(2):100-101. 被引量：2
9黄剑华,承恒达,吴锐,刘家锋.基于模糊同质性映射的文本检测方法[J].电子与信息学报,2008,30(6):1376-1380. 被引量：5
10郑雄波,张晓威,朱磊.一种小波域内图像的文本信息提取算法[J].哈尔滨商业大学学报（自然科学版）,2008,24(3):281-284.

同被引文献16

1欧文武,朱军民,刘昌平.自然场景文本定位[J].中文信息学报,2004,18(5):42-47. 被引量：17
2欧文武,朱军民,刘昌平.视频文本定位[J].计算机工程与应用,2004,40(30):65-67. 被引量：3
3章东平,徐志江,金朝晖.彩色图像中文本的定位[J].电路与系统学报,2006,11(4):142-146. 被引量：2
4晋瑾,平西建,张涛,陈明贵.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11. 被引量：17
5Jung K, Kim K I, Jain A K. Text information extraction in images and video:a survey[J]. Pattern Recognition, 2004,37(5):977-997.
6Zhu K, Qi F, Jiang R, et al. Using adaboost to detect and segment characters from natural scenes.In:Proceedings of the First International Workshop on Camera Based Document Analysis and Recognition, Seoul, Korea:IEEE Computer Society,2005.52-59.
7Liu Y, Goto S, Ikenaga T, et al. A robust algorithm for text detection in color images. In: Proceedings of the 8th International Conference on Document Analysis and Recognition, Seoul, Korea: IEEE Computer Society,2005.399-403.
8Fukunaga K, Hostetler L D. The Estimation of the Gradient of a Density Function, with Application in Pattern Recognition[J]. IEEE Trans on Information Theory, 1975,21(1): 32-40.
9Cheng YZ, "Mean Shift,Mode Seeking,and Clustering."IEEE Trans.Pattern Analysis and Machine Intelligence,vol.17, no.8,pp. 790-799,aug. 1995.
10Comaniciu D,Meer P. Mean shift: A robust approach toward feature space analysis [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603-619.

引证文献3

1陈孝玉,李春利.基于连通域的图像文本自动定位[J].微计算机信息,2009,25(28):123-125. 被引量：2
2胡倩,洪留荣,马玲玲.自然场景下的文本定位[J].电脑知识与技术,2013,9(8):5121-5125.
3王静,田洋洋,皇甫海燕.基于连通域阈值的自然场景文本图像分割技术[J].新疆师范大学学报（自然科学版）,2015,34(1):12-15. 被引量：1

二级引证文献3

1李春利,王雪扬,惠康华.一种基于连通域分析的车牌定位方法[J].智能计算机与应用,2012,2(4):90-92. 被引量：1
2胡倩,洪留荣,马玲玲.自然场景下的文本定位[J].电脑知识与技术,2013,9(8):5121-5125.
3刘杨.复杂场景下基于Radon校正与MSER的文本定位算法研究[J].微型机与应用,2016,35(21):42-44. 被引量：1

1黄仲钊.几种神经网络在入侵检测系统中的应用综述[J].知识经济,2009(5):103-104. 被引量：2
2常磊,宋玲,吴丹.混合神经网络在入侵检测系统中的应用研究[J].微计算机信息,2012(9):407-408.
3马晓岩,秦江敏,李春霞.目标检测中基于Kohonen网络的特征提取方法[J].模式识别与人工智能,2002,15(3):326-329.
4吕小星.MLP网络递推最小二乘反向传播学习算法的研究[J].北京广播电视大学学报,1997(1):52-55.
5刘荷花.基于MLP优化网络的报警关联技术[J].火力与指挥控制,2013,38(2):9-13.
6赵英凯.基于MLP网络的智能控制及应用[J].南京化工大学学报,1996,18(3):12-16.
7彭菊萍.基于MATLAB的BP神经网络改进算法研究[J].黑龙江科技信息,2014(6):124-124. 被引量：2
8都军伟,王永纲,杨阳,李凯.前向MLP网络的FPGA实现[J].数据采集与处理,2010,25(1):39-43. 被引量：1
9毛六平,唐艳,王耀南.基于模糊MLP网络的清浊音判决[J].湖南师范大学自然科学学报,2003,26(4):27-30. 被引量：2
10李银国,曹长修.神经元网络鲁棒能量函数的构造原理[J].模式识别与人工智能,1996,9(1):1-9. 被引量：7

微计算机信息

2008年第18期

浏览历史

内容加载中请稍等...

面向复杂场景图像的文本定位新方法被引量：3

参考文献7

二级参考文献6

共引文献25

同被引文献16

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向复杂场景图像的文本定位新方法 被引量：3

参考文献7

二级参考文献6

共引文献25

同被引文献16

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向复杂场景图像的文本定位新方法被引量：3