基于连通区域和统计特征的图像文本定位被引量：5

Text location in image based on connected-component and statistical features

下载PDF

导出

摘要文本定位是图像中文本提取的前提与基础。针对场景图像中背景复杂和光照影响,提出一种由粗略到精确的文本定位算法。该算法首先在边缘图像上利用连通区域分析进行粗略定位得到文本候选区域,然后提取候选区域的方向梯度直方图特征和改进的局部二值模式特征进行分类,去除虚假文本达到精确定位。仿真实验结果表明,该算法能够有效地降低背景复杂与光照不均的影响,在场景图像中准确地定位文本区域。 Text location is the premise and foundation of text extraction in images. In order to overcome the complex background and the effect of illumination, a coarse-to-fine text location algorithm is proposed. The algorithm firstly uses connected-component analysis for coarsely locating on the edge image, and then extracts histogram of oriented gradient feature and modified local binary patterns feature to classify the candidate regions, removes the false text to achieve accurate location. Experimental results indicate that this algorithm can effectively reduce the influence of non-uniform illumination and complex background, accurately locate the text area in scene image.

作者刘亚亚于凤芹陈莹

机构地区江南大学物联网工程学院

出处《计算机工程与应用》 CSCD 北大核心 2016年第5期165-168,208,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61104213)

关键词文本定位连通区域分析方向梯度直方图特征局部二值模式特征 text location connected-component analysis histogram of oriented gradient feature local binary patterns feature

分类号 TN911.73 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献15

1Jung K,Kim K I,Jain A K.Text information extraction in images and video:a survey[J].Pattern Recognition,2004,37(5):977-997.
2Pan Y F,Hou X,Liu C L.Text localization in natural scene images based on conditional random field[C]//Proceedings of IEEE 10th International Conference on Document Analysis and Recognition(ICDAR),2009:6-10.
3Shivakumara P,Phan T Q,Tan C L.A Laplacian approach to multi-oriented text detection in video[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(2):412-419.
4Lucas S M.ICDAR 2005 text locating competition results[C]//Proceedings of the International Conference on Document Analysis and Recognition(ICDAR),2005:80-84.
5Epshtein B,Ofek E,Wexler Y.Detecting text in natural scenes with stroke width transform[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR),2010:2963-2970.
6Yi C C,Tian Y L.Text string detection from natural scenes by structure-based partition and grouping[J].IEEETransactions on Image Processing,2011,20(9):2594-2605.
7Ye J,Huang L L,Hao X L.Neural network based text detection in videos using local binary patterns[C]//IEEEChinese Conference on Pattern Recognition(CCPR),2009:1-5.
8刘晓佩,卢朝阳,李静.结合WTLBP特征和SVM的复杂场景文本定位方法[J].西安电子科技大学学报,2012,39(4):103-108. 被引量：11
9Hanif S M,Prevost L.Text detection in natural scene images using spatial histograms[C]//Proceedings of the2nd Workshop on Camera Based Document Analysis and Recognition(CBDAR),2007:122-129.
10Yi C C,Tian Y L.Text detection in natural scene images by stroke gabor words[C]//Proceedings of the IEEE International Conference on Document Analysis and Recognition(ICDAR),2011:177-181.

二级参考文献24

1陈华,金伟其,张楠,石俊生,王霞.基于神经网络的三维宽场显微图像复原研究[J].光子学报,2006,35(3):473-476. 被引量：12
2张变莲,唐慧君,闫旻奇.一种复杂车辆图像中的多车牌定位方法[J].光子学报,2007,36(1):184-187. 被引量：15
3晋瑾,平西建,张涛,陈明贵.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11. 被引量：17
4JAIN A K, YU Bin. Automatic text location in images and video frames[J]. Pattern Recognition, 1998,31 (12):2055-2076.
5LI Hui-ping, DOERMANN D, KIA O. Automatic text detection and tracking in digital video[J]. IEEE Transactions on Image Processing, 2000,9(1) : 147-156.
6HASAN Y M Y,KARAM L J. Morphological text extraction from images[J]. IEEE Transactions on Image Processing, 2000,9(11) :1978-1983.
7CLARK P,MIRMEHDI M. Combining statistical measures to find image text regions[C]. Proceedings of ICPR, 2000,1 : 450-453.
8张敏,何小海,陶青川,李蕊,余艳梅.基于小波变换的深度预测复原算法研究[J].光子学报,2007,36(9):1754-1758. 被引量：2
9Zhang J, Kasturi R. Extraction of Text Objects in Video Documents: Recent Progress[C]//Proc of the 8th International Conference on Pattern Recognition. New York: IEEE Computer Society, 2008: 5-17.
10Liang J, Doermann D, Li H P. Camera-based Analysis of Text and Documents: a Survey[J]. International Journal on Document Analysis and Recognition, 2005, 7(2-3) : 84-104.

共引文献57

1叶红兵,弟宇鸣,邱晓林,韩峰.重叠核径迹图像的分割与参数统计算法研究[J].原子能科学技术,2006,40(B09):93-96. 被引量：1
2简江涛,安滨,熊进,刘军伟,冯焕清.中国数字人切片图像的自动配准与分割方法研究[J].中国科学技术大学学报,2007,37(2):130-134. 被引量：3
3石斌,袁心强.全自动钻石切工分析系统的原理和应用[J].宝石和宝石学杂志,2007,9(1):5-8. 被引量：6
4弟宇鸣,叶红兵,邱晓林,李天柁.基于MATLAB核径迹图像聚焦算法的研究[J].核科学与工程,2006,26(4):316-320. 被引量：1
5宁旭,张绍祥,谭立文,邱全光.数字化可视人体图像的目标提取[J].第三军医大学学报,2007,29(16):1549-1551.
6王长龙,纪凤珠,王建斌,左宪章.油气管道漏磁检测缺陷的三维成像技术[J].石油学报,2007,28(5):146-148. 被引量：10
7过惠平,姚红伟,叶红兵,邓福威.基于流域算法的重叠核径迹图像分割方法研究[J].核科学与工程,2007,27(3):213-217. 被引量：4
8陈宇拓,韦冰,邱自华,丁灿剑.基于分段Bezier曲线的手绘雕刻图案矢量化[J].计算机工程,2008,34(9):208-210. 被引量：4
9赵攀,陈恳,汪一聪,杨任尔.基于形状及边界参数的凸形图像公制周长的计算方法研究[J].宁波大学学报（理工版）,2008,21(3):297-300.
10张雪峰,尚金奎.基于蒙特卡罗方法和粗糙熵标准的图像分割方法[J].石油化工高等学校学报,2009,22(3):94-98. 被引量：2

同被引文献39

1张修军,郭霞,金心宇.带标记矫正的二值图象连通域像素标记算法[J].中国图象图形学报（A辑）,2003,8(2):198-202. 被引量：44
2于建涛,林晓明.3D通用人脸模型的自适应算法及应用[J].计算机工程与应用,2005,41(20):67-69. 被引量：2
3左文明.连通区域提取算法研究[J].计算机应用与软件,2006,23(1):97-98. 被引量：31
4陈柏生.一种二值图像连通区域标记的新方法[J].计算机工程与应用,2006,42(25):46-47. 被引量：58
5李刚,曾锐利,林凌,王蒙军.基于数学形态学的车牌定位算法[J].仪器仪表学报,2007,28(7):1323-1327. 被引量：67
6高红波,王卫星.一种二值图像连通区域标记的新算法[J].计算机应用,2007,27(11):2776-2777. 被引量：75
7江早,刘晋军,王冬,刘积仁.一种可交互删改的二值图像快速连通体标识方法[J].东北大学学报（自然科学版）,1998,19(3):251-254. 被引量：6
8刘国宏,郭文明.改进的中值滤波去噪算法应用分析[J].计算机工程与应用,2010,46(10):187-189. 被引量：85
9胡将胜,侯建华.基于区域标注的车牌提取算法研究[J].科学技术与工程,2011,11(2):378-382. 被引量：5
10张浩鹏,王宗义.基于灰度方差和边缘密度的车牌定位算法[J].仪器仪表学报,2011,32(5):1095-1102. 被引量：42

引证文献5

1王梦迪,张友梅,常发亮.基于边缘检测和特征融合的自然场景文本定位[J].计算机科学,2017,44(9):300-303. 被引量：5
2王晓群,刘宏志.基于自适应数学形态学的车牌定位研究[J].图学学报,2017,38(6):843-850. 被引量：15
3郭飞燕,李晓静.改进的连通区域标记算法在人脸五官识别定位技术的应用[J].科技通报,2019,35(5):71-74. 被引量：1
4张荣辉,黄敏,江华丽,胡香琳.基于51与K66双芯片的智能小车控制系统[J].计算机系统应用,2022,31(2):96-101. 被引量：2
5马巧梅,石桓印,康珺.最大稳定极值区域与角点检测结合的医疗图像文本区域检测算法[J].科学技术与工程,2019,19(6):174-179. 被引量：4

二级引证文献27

1刘立伟,谷学静.复杂光照条件下车牌定位算法研究[J].信息通信,2018,31(8):34-35. 被引量：2
2盛兆亮,高军伟.基于区域统计和BP神经网络的车牌识别[J].电子测量技术,2019,42(8):78-82. 被引量：15
3朱桂斌,钟刘翔.基于视频文字识别的跑步成绩自动测量系统研究[J].科技与创新,2018(22):45-47.
4罗山.一种基于形态学与区域分析的车牌定位方法[J].山西电子技术,2018(6):11-14. 被引量：4
5罗山,李玉莲.车牌定位方法综述[J].山西电子技术,2019(1):94-96. 被引量：2
6钱江,张桂荣,姚江,季建中,何平,顾宋华.最稳定极值区域与边缘增强的船名定位方法[J].计算机应用与软件,2019,36(2):264-268. 被引量：4
7罗山.基于数学形态学与投影法的车牌定位[J].攀枝花学院学报,2019,36(2):72-75. 被引量：2
8朱文佳,陈宇红,冯瑜瑾,王俊,余烨.一种基于目标优化学习的车标识别方法[J].图学学报,2019,40(4):689-696. 被引量：2
9周光祥,叶俊明.基于LabVIEW和小波变换的车牌识别算法设计与实现[J].数码世界,2019,0(8):46-46.
10罗山.基于改进数学形态学的车牌定位[J].山西电子技术,2019,0(5):9-11.

1徐琼,干宗良,刘峰,陈昌红.基于提升树的自然场景中文文本定位算法研究[J].南京邮电大学学报（自然科学版）,2013,33(6):76-82. 被引量：4
2杨云,郭建强,罗林,张文.基于HOG和SVM的通信设备工具板检测方法[J].信息技术,2016,40(2):157-159.
3朱伟,叶飞,马超,张重阳.一种基于监控视频的出租车识别方法[J].电视技术,2013,37(7):154-156.
4欧中亚,山田宏尚.联合部件特征与增强SVM的行人检测算法[J].电子技术应用,2017,43(4):133-137. 被引量：1
5杨恒,钱钧,纪明,孙小炜,陆阳,宋金鸿.基于动态特征融合的粒子滤波目标跟踪算法[J].应用光学,2012,33(4):703-710. 被引量：1
6李广,罗传旭,孟晖,张宝珍.基于峰值特征匹配的运动补偿算法[J].无线电工程,2012,42(7):25-28. 被引量：2
7姜维,卢朝阳,李静,刘晓佩.基于角点类别特征和边缘幅值方向梯度直方图统计特征的复杂场景文字定位算法[J].吉林大学学报（工学版）,2013,43(1):250-255. 被引量：4
8阿地力.依米提,刘吉超,王静.彩色背景图像中维吾尔文字定位的研究[J].新疆师范大学学报（自然科学版）,2012,31(4):42-45. 被引量：1
9喻勃然,万洪杰.基于启发式规则和SVM的自然场景中文文本定位[J].电子设计工程,2016,24(24):161-164. 被引量：3
10张引,潘云鹤.复杂背景下文本提取的彩色边缘检测算子设计[J].软件学报,2001,12(8):1129-1135. 被引量：20

计算机工程与应用

2016年第5期

浏览历史

内容加载中请稍等...

基于连通区域和统计特征的图像文本定位被引量：5

参考文献15

二级参考文献24

共引文献57

同被引文献39

引证文献5

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于连通区域和统计特征的图像文本定位 被引量：5

参考文献15

二级参考文献24

共引文献57

同被引文献39

引证文献5

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

基于连通区域和统计特征的图像文本定位被引量：5