基于深度学习的场景文字检测与识别综述被引量：2

Deep learning based scene text detection and recognition:A survey

下载PDF

导出

摘要近年来,基于深度学习的场景文字检测和识别研究已成为计算机视觉领域的一个研究热点。本文首先介绍了场景文字检测与识别所面临的挑战,其次从场景文字检测、场景文字识别和端到端文字识别三个任务分别综述了最新的研究工作,然后列出了该领域比较常用的大型公开数据集情况,最后总结和展望了最新的研究趋势。 In recent years, deep learning based scene text detection and recognition has become a research hot spot in the field of computer vision. The paper first introduces the challenges of scene text detection and recognition. Secondly, we review the latest research work from three tasks: scene text detection, scene text recognition and end-to-end text recognition. Then we list the opened big data sets commonly used in this field, and finally summarize and look forward to the latest research trends and focus.

作者艾合麦提江·麦提托合提艾斯卡尔·艾木都拉阿布都萨拉木·达吾提 AHMATJAN Mattohti;ASKAR Hamdulla;ABDUSALAM Dawut(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;School of Software,Xinjiang University,Urumqi 830046,China)

机构地区新疆大学信息科学与工程学院新疆大学软件学院

出处《电视技术》 2019年第14期65-70,共6页 Video Engineering

基金国家自然科学基金(61662076)

关键词深度学习场景文字文字检测文字识别端到端识别 deep learning scene text text detection text recognition end-to-end text recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：49
2Yingying ZHU,Cong YAO,Xiang BAI.Scene text detection and recognition： recent advances and future trends[J].Frontiers of Computer Science,2016,10(1):19-36. 被引量：21
3白翔,杨明锟,石葆光,廖明辉.基于深度学习的场景文字检测与识别[J].中国科学：信息科学,2018,48(5):531-544. 被引量：35
4姜维,张重生,殷绪成.基于深度学习的场景文字检测综述[J].电子学报,2019,47(5):1152-1161. 被引量：27

二级参考文献100

1Tsai S S, Chen H, Chen D, Schroth G, Grzeszczuk R, Girod B. Mobile Yingying ZHU et al. Scene text detection and recognition: recent advances and future trends visual search on printed documents using text and low bit-rate features. In: Proceedings of the 18th IEEE International Conference on Image Processing. 2011, 2601-2604.
2Barber D B, Redding J D, McLain T W, Beard R W, Taylor CN. Vision-based target geo-location using a fixed-wing miniature air vehi?cle. Journal of Intelligent and Robotic Systems, 2006, 47(4): 361-382.
3Kisacanin B, Pavlovic V, Huang T S. Real-time vision for human?computer interaction. Springer Science and Business Media, 2005.
4DeSouza G N, Kak A C. Vision for mobile robot navigation: a sur?vey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(2): 237-267.
5Ham Y K, Kang M S, Chung H K, Park R H, Park G T. Recognition of raised characters for automatic classification of rubber tires. Optical Engineering. 1995, 34(1): 102-109.
6Yao C, Zhang X, Bai X, Liu W, Tu Z. Rotation-invariant features for multi-oriented text detection in natural images. PloS one, 2013, 8(8): e70173.
7Yao C, Bai X, Shi B, Liu W. Strokelets: A learned multi-scale represen?tation for scene text recognition. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. 2014, 4042-4049.
8Chen X, Yuille A L. Detecting and reading text in natural scenes. In: Proceedings of 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2004, 2.
9Epshtein B, Ofek E, Wexler Y. Detecting text in natural scenes with stroke width transform. In: Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition. 2010, 2963-2970.
10Neumann L, Matas J. A method for text localization and recognition in real-world images. Lecture Notes in Computer Science, 2011, 6494, 770-783.

共引文献118

1Minghui LIAO,Boyu SONG,Shangbang LONG,Minghang HE,Cong YAO,Xiang BAI.SynthText3D:synthesizing scene text images from 3D virtual worlds[J].Science China(Information Sciences),2020,63(2):65-78. 被引量：2
2姚砺,王昭丽.基于深度学习的驾驶证识别方法研究[J].智能计算机与应用,2020,10(7):40-43. 被引量：4
3闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：5
4王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：49
5张矿,朱远平.基于超像素融合的文本分割[J].计算机应用,2016,36(12):3418-3422. 被引量：2
6杨飞.自然场景图像中的文字检测综述[J].电子设计工程,2016,24(24):165-168. 被引量：12
7李翌昕,马尽文.文本检测算法的发展与挑战[J].信号处理,2017,33(4):558-571. 被引量：8
8Junge ZHANG,Kaiqi HUANG,Tieniu TAN,Zhaoxiang ZHANG.Local structured representation for generic object detection[J].Frontiers of Computer Science,2017,11(4):632-648. 被引量：1
9朱盈盈,张拯,章成全,张兆翔,白翔,刘文予.适用于文字检测的候选框提取算法[J].数据采集与处理,2017,32(6):1097-1106. 被引量：2
10白翔,杨明锟,石葆光,廖明辉.基于深度学习的场景文字检测与识别[J].中国科学：信息科学,2018,48(5):531-544. 被引量：35

同被引文献12

1陈兆凡,赵春阳,李博.一种改进IoU损失的边框回归损失函数[J].计算机应用研究,2020,37(S02):293-296. 被引量：17
2骆遥.基于深度全卷积神经网络的文字区域定位方法[J].无线互联科技,2016,13(23):43-44. 被引量：1
3彭艳兵,关韵竹.基于区域特征与支持向量机的场景文字定位算法[J].计算机与现代化,2016(12):87-91. 被引量：1
4杨飞.自然场景图像中的文字检测综述[J].电子设计工程,2016,24(24):165-168. 被引量：12
5张国和,黄凯,张斌,符欢欢,赵季中.最大稳定极值区域与笔画宽度变换的自然场景文本提取方法[J].西安交通大学学报,2017,51(1):135-140. 被引量：18
6朱盈盈,张拯,章成全,张兆翔,白翔,刘文予.适用于文字检测的候选框提取算法[J].数据采集与处理,2017,32(6):1097-1106. 被引量：2
7郭芬红,谢立艳,熊昌镇.自然场景图像文字检测研究综述[J].计算机应用,2018,38(A01):173-178. 被引量：8
8姜维,张重生,殷绪成.基于深度学习的场景文字检测综述[J].电子学报,2019,47(5):1152-1161. 被引量：27
9杨剑锋,王润民,何璇,李秀梅,钱盛友.基于FCN的多方向自然场景文字检测方法[J].计算机工程与应用,2020,56(2):164-170. 被引量：13
10张月,刘彩云,熊杰.基于VGG-19图像风格迁移算法的设计与分析[J].信息技术与信息化,2020(1):70-72. 被引量：5

引证文献2

1李益红,陈袁宇.深度学习场景文本检测方法综述[J].计算机工程与应用,2021,57(6):42-48. 被引量：7
2唐文军,盛鹏,符佳,徐苏.基于深度学习的场景文字检测方法的研究[J].阜阳师范大学学报（自然科学版）,2023,40(1):64-71.

二级引证文献7

1胡高丽,文成玉.自然场景下交通标识文本检测与识别算法研究[J].成都信息工程大学学报,2022,37(2):171-176. 被引量：2
2周冲浩,顾勇翔,彭程.基于多尺度特征融合的自然场景文本检测[J].计算机应用,2022,42(S02):31-35. 被引量：2
3周燕,韦勤彬,廖俊玮,曾凡智,冯文婕,刘翔宇,周月霞.自然场景文本检测与端到端识别:深度学习方法[J].计算机科学与探索,2023,17(3):577-594. 被引量：4
4杨仁桓,康家杰,秦传波,麦超云,邱天,喻慧文.基于深度学习的场景图像自适应文本检测方法[J].现代电子技术,2023,46(16):143-148.
5赵麒博,王梦梅,潘海英,李晨欢,吴祥龙,郭晨阳.基于改进YOLOv5和DeepSort的车道线检测方法[J].信息技术与信息化,2023(7):217-220.
6王昌波,仝明磊.基于高斯密度图的自然场景中文文字检测[J].电子设计工程,2023,31(18):168-173.
7魏哲亮,李岳阳,罗海驰.多尺度池化和双向特征融合的场景文本检测[J].计算机工程与应用,2024,60(2):154-161. 被引量：1

1教学参考之一开展主题教育,中央政治局率先垂范[J].党课,2019,0(21):18-19.
2许可,高尚.深度卷积神经网络LeNet-5和ResNet的对比以及应用分析[J].电子设计工程,2020,28(2):82-85. 被引量：10
3蒋冲宇,鲁统伟,闵峰,熊寒颖,胡记伟.基于神经网络的发票文字检测与识别方法[J].武汉工程大学学报,2019,41(6):586-590. 被引量：12
4李新叶,朱婧,麻丽娜.基于深度学习的场景识别方法综述[J].计算机工程与应用,2020,56(5):25-33. 被引量：8
5张丹丹.充满生活情致的幼儿生活场的创设与实施策略研究[J].课程教育研究,2019,0(46):253-253. 被引量：1
6高锦雄,杨宏业.基于深度学习的盲人识别研究[J].内蒙古工业大学学报（自然科学版）,2019,38(6):454-459.
7朱明荣.基于视频图像的人脸识别与跟踪探析[J].电子世界,2020,0(1):72-73. 被引量：1
8王子阳,魏丹,胡晓强,罗一平,方轶.基于HOG局部双线性插值的机械零部件检测与识别[J].轻工机械,2020,38(1):65-70. 被引量：5
9刘成林.文档图像识别技术回顾与展望[J].数据与计算发展前沿,2019,1(2):17-25. 被引量：6
10屈雯怡.基于YOLOv3的船舶实时监测识别[J].计算机与现代化,2020,0(3):115-120. 被引量：1

电视技术

2019年第14期

浏览历史

内容加载中请稍等...

基于深度学习的场景文字检测与识别综述被引量：2

参考文献4

二级参考文献100

共引文献118

同被引文献12

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度学习的场景文字检测与识别综述 被引量：2

参考文献4

二级参考文献100

共引文献118

同被引文献12

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度学习的场景文字检测与识别综述被引量：2