基于笔画角度变换和宽度特征的自然场景文本检测被引量：4

Text detection based on stroke angle conversion and stroke width features in natural scene

下载PDF

导出

摘要针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画外边界优劣角变换次数和增强笔画支持像素面积比两种特征。前者分段统计笔画外轮廓角度变换次数;后者计算笔画宽度稳定区域在笔画总面积的占比,用来分别反映笔画角度和宽度变化稳定特性。为降低文本漏检率,采用多通道最大稳定极值区域(maximally stable extremal regions,MSER)检测,合并所有候选区域,提取候选区域的笔画特征和纹理特征,利用支持向量机完成文本和非文本区域分类。在ICDAR2015数据库上,算法的精确率和召回率分别达到79. 3%和72. 8%,并在一定程度上解决了光照不均和复杂背景的问题。 In order to reduce the missing detection and misclassification of text caused by uneven illumination and background complexity in text detection of natural scenes,this paper presented a natural scene text detection method based on stroke angle transformation and width features.Compared to non-text,the text has a more stable performance of stroke outline angle conversion times and stroke width.Therefore,this paper proposed methods of extracting the number of transformations of the outer corner of the stroke and the enhancement of the pixel area ratio of the stroke support.In order to extract the characteristics of angular conversion,it used the method of outer contour segmentation to calculate the number of conversion times.In order to extract the strokes width characteristics,it calculated the proportion of the width stable area in the total strokes area.To reduce rate of the text missing detection,it used multi-channel MSER to detect text candidate area.Candidate areas in all channels were merged to extract the stroke and texture features.It also adopted support vector machines combined with features to classify text and non-text.The simulations show that the accuracy and recall rate of the algorithm were 79.3%and 72.8%in the ICDAR2015 database,respectively.Moreover,it solves the problem of uneven illumination and complex background to some extent.

作者陈硕郑建彬詹恩奇汪阳 Chen Shuo;Zheng Jianbin;Zhan Enqi;Wang Yang(College of Information Engineering,Wuhan University of Technology,Wuhan 430070,China;Key Laboratory of Fiber Optic Sensing Technology&Information Processing for Ministry of Education,Wuhan 430070,China)

机构地区武汉理工大学信息工程学院光纤传感技术与信息处理教育部重点实验室

出处《计算机应用研究》 CSCD 北大核心 2019年第4期1270-1274,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61303028)

关键词自然场景文本检测笔画特征 natural scene text detection stroke feature

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1Yingying ZHU,Cong YAO,Xiang BAI.Scene text detection and recognition： recent advances and future trends[J].Frontiers of Computer Science,2016,10(1):19-36. 被引量：22

二级参考文献98

1Tsai S S, Chen H, Chen D, Schroth G, Grzeszczuk R, Girod B. Mobile Yingying ZHU et al. Scene text detection and recognition: recent advances and future trends visual search on printed documents using text and low bit-rate features. In: Proceedings of the 18th IEEE International Conference on Image Processing. 2011, 2601-2604.
2Barber D B, Redding J D, McLain T W, Beard R W, Taylor CN. Vision-based target geo-location using a fixed-wing miniature air vehi?cle. Journal of Intelligent and Robotic Systems, 2006, 47(4): 361-382.
3Kisacanin B, Pavlovic V, Huang T S. Real-time vision for human?computer interaction. Springer Science and Business Media, 2005.
4DeSouza G N, Kak A C. Vision for mobile robot navigation: a sur?vey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(2): 237-267.
5Ham Y K, Kang M S, Chung H K, Park R H, Park G T. Recognition of raised characters for automatic classification of rubber tires. Optical Engineering. 1995, 34(1): 102-109.
6Yao C, Zhang X, Bai X, Liu W, Tu Z. Rotation-invariant features for multi-oriented text detection in natural images. PloS one, 2013, 8(8): e70173.
7Yao C, Bai X, Shi B, Liu W. Strokelets: A learned multi-scale represen?tation for scene text recognition. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. 2014, 4042-4049.
8Chen X, Yuille A L. Detecting and reading text in natural scenes. In: Proceedings of 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2004, 2.
9Epshtein B, Ofek E, Wexler Y. Detecting text in natural scenes with stroke width transform. In: Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition. 2010, 2963-2970.
10Neumann L, Matas J. A method for text localization and recognition in real-world images. Lecture Notes in Computer Science, 2011, 6494, 770-783.

共引文献21

1王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：51
2张矿,朱远平.基于超像素融合的文本分割[J].计算机应用,2016,36(12):3418-3422. 被引量：2
3杨飞.自然场景图像中的文字检测综述[J].电子设计工程,2016,24(24):165-168. 被引量：12
4李翌昕,马尽文.文本检测算法的发展与挑战[J].信号处理,2017,33(4):558-571. 被引量：8
5Junge ZHANG,Kaiqi HUANG,Tieniu TAN,Zhaoxiang ZHANG.Local structured representation for generic object detection[J].Frontiers of Computer Science,2017,11(4):632-648. 被引量：1
6朱盈盈,张拯,章成全,张兆翔,白翔,刘文予.适用于文字检测的候选框提取算法[J].数据采集与处理,2017,32(6):1097-1106. 被引量：2
7白翔,杨明锟,石葆光,廖明辉.基于深度学习的场景文字检测与识别[J].中国科学：信息科学,2018,48(5):531-544. 被引量：35
8刘美华,傅彩明,梁开健,周细凤.应用MSER和局部二值化的网络图片文本定位[J].光电子．激光,2018,29(6):660-668. 被引量：2
9陈晓龙,陈显龙,袁建平,高宇豆,张加其.基于深度学习的电力设备铭牌识别[J].广西大学学报（自然科学版）,2018,43(6):2216-2226. 被引量：15
10Anna ZHU,Seiichi UCHIDA.Scene word recognition from pieces to whole[J].Frontiers of Computer Science,2019,13(2):292-301. 被引量：1

同被引文献24

1林祥国,张继贤,李海涛,杨景辉.基于T型模板匹配半自动提取高分辨率遥感影像带状道路[J].武汉大学学报（信息科学版）,2009,34(3):293-296. 被引量：43
2王文哲.数字文本资料修复中的字符分割法及应用[J].现代图书情报技术,2010(3):82-85. 被引量：1
3张雷雨,邵永社,杨毅,韩阳.基于改进的Mean Shift方法的高分辨率遥感影像道路提取[J].遥感信息,2010,32(4):3-7. 被引量：5
4刘小丹,刘岩.基于Hough变换和数学形态学的遥感影像城区道路提取[J].南京师大学报（自然科学版）,2010,33(4):128-133. 被引量：10
5李华胜,黄平平,苏莹.一种提取遥感影像中道路信息的方法[J].国土资源遥感,2015,27(2):56-62. 被引量：8
6胡华龙,吴冰,黄邵美.结合Gabor纹理与几何特征的高分辨率遥感影像城区道路提取方法[J].测绘科学技术学报,2015,32(4):395-400. 被引量：13
7符喜优,张风丽,王国军,邵芸.结合张量投票和Snakes模型的SAR图像道路提取[J].中国图象图形学报,2015,20(10):1403-1411. 被引量：9
8刘亚亚,于凤芹,陈莹.基于笔画宽度变换的场景文本定位[J].小型微型计算机系统,2016,37(2):350-353. 被引量：7
9谭媛,黄辉先,徐建闽,陈任.基于改进Sobel算子的遥感图像道路边缘检测方法[J].国土资源遥感,2016,28(3):7-11. 被引量：33
10朱恩泽,宋伟东,戴激光.改进支持向量机的高分遥感影像道路提取[J].测绘科学,2016,41(12):224-228. 被引量：14

引证文献4

1杨谢柳,牛玺辉,梁文峰.面向非规则排列汉字文本的字符分割方法[J].计算机辅助设计与图形学学报,2019,31(9):1542-1548. 被引量：5
2张霞,张春亢,李红梅,罗竹,林健云.结合笔画宽度变换与均值漂移的遥感影像道路提取[J].测绘科学技术学报,2019,36(3):287-292. 被引量：6
3刘艳丽,王毅宏,张恒,程晶晶.嵌入重评分机制的自然场景文本检测方法[J].计算机仿真,2023,40(2):228-235.
4徐武,杨昊东,陈盈君,汤弘毅.基于ASHE和SWT的低对比度自然场景图像文字定位[J].计算机应用与软件,2023,40(3):229-234.

二级引证文献11

1邵小美,张春亢,韦永昱,周成宇.道路信息提取的GF-2影像融合方法对比分析[J].智能计算机与应用,2022,12(2):152-157.
2付鹏斌,彭荆旋,杨惠荣,李建君.基于多重几何特征和CNN的脱机手写算式识别[J].计算机系统应用,2020,29(8):271-279. 被引量：2
3罗珣,张晴宇,方芳,路强.EmailVis电子邮件中事件可视分析[J].计算机辅助设计与图形学学报,2021,33(1):19-28.
4张小东,杜宁,王莉,张春亢,王庆余.一种高斯混合模型组合分类的机载LiDAR城区道路提取方法[J].计算机技术与发展,2021,31(2):60-64. 被引量：3
5吕喜容.基于遥感影像的地图道路网数据变化检测分析[J].经纬天地,2021(4):31-35.
6李镇锋,陈晓荣,陈梦华,卢德运,陈运豪.基于图像熵和傅里叶变换的复杂背景分割[J].软件工程,2021,24(11):19-23. 被引量：5
7桂方燚,武文星,任维康.基于PSO-CNN神经网络的车牌识别系统[J].华北科技学院学报,2021,18(5):100-106. 被引量：2
8韦春桃,何蔚.结合改进SWT和EMD的高分遥感影像道路提取[J].遥感信息,2022,37(1):61-69. 被引量：2
9靳延伟,董昱,张晓丽.包围圆分割在铁路货车车号字符的应用[J].重庆大学学报,2022,45(7):112-121.
10王敬淳,汤圣君,王伟玺,李晓明,李游,谢林甫,朱家松.室内三维点云空间自动划分与规则化方法[J].测绘通报,2022(8):93-97. 被引量：1

1马震安.巧用直方图分段统计[J].电脑爱好者,2019,0(2):51-51.
2毕林,李亚龙,郭昭宏.基于深度卷积神经网络的卡车装载矿石量估计研究[J].黄金科学技术,2019,27(1):112-120. 被引量：3
3王睿,李平,盛斌,谯从彬,马利庄,吴恩华.基于高通差异性特征的图像质量评估方法[J].系统仿真学报,2019,31(2):227-237. 被引量：1
4范青帅,范宏波,林宇,张晋,林丹丹,杨超,朱亮,李伟.基于长线列扫描周视红外成像的多目标提取方法综述[J].红外技术,2019,41(2):118-126. 被引量：2
5汪洋,王俊刚.基于深度学习算法的铁路列车运行安全检测[J].中国安全科学学报,2018,28(S2):41-45. 被引量：16
6王艳,谢广苏,沈晓宇.一种基于MSER和SWT的新型车牌检测识别方法研究[J].计量学报,2019,40(1):82-90. 被引量：26
7李宗民,张洲凯,刘玉杰.基于像素自适应背景建模的运动目标分割[J].计算机工程与设计,2018,39(3):785-791. 被引量：3
8戴玉静,李辉,张静.基于模糊线段和链码相结合的关键点检测方法[J].工业控制计算机,2018,31(10):77-78.
9刘世聪,李震.海洋石油平台电缆放线架设计与应用[J].海洋工程装备与技术,2018,5(B10):279-281. 被引量：4
10茅正冲,沈雪松.融合多尺度变换的改进Vibe算法[J].激光与光电子学进展,2018,55(11):315-322. 被引量：12

计算机应用研究

2019年第4期

浏览历史

内容加载中请稍等...

基于笔画角度变换和宽度特征的自然场景文本检测被引量：4

参考文献1

二级参考文献98

共引文献21

同被引文献24

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于笔画角度变换和宽度特征的自然场景文本检测 被引量：4

参考文献1

二级参考文献98

共引文献21

同被引文献24

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于笔画角度变换和宽度特征的自然场景文本检测被引量：4