基于CRNN模型的中文场景文字识别被引量：4

ChineseScene Text Recognition based on CRNN model

下载PDF

导出

摘要中文场景文字识别(STR)是光学字符识别(OCR)技术的重要研究方向,在拍照翻译、无人驾驶等领域广泛应用。但是,中文场景下的文字面临着字体和字符种类多、文字背景复杂等问题。本文着眼于“中国街景”图像,基于CRNN模型提出了一种免分割、端到端的中文场景文字识别方法。首先CNN提取图像卷积特征,然后RNN进行序列特征预测,其中Bi-GRU有效抑制梯度消失或梯度爆炸,Dropout可以防止过拟合,最后引入CTC作为损失函数解决训练时字符无法对齐的问题。本文用Python实现了算法,以较好的效果完成了实验。 Chinese scene character recognition(STR)is an important research direction of optical character recognition(OCR)technology,which is widely used in the fields of photo translation and unmanned driving.However,the characters in Chinese scene are faced with many problems,such as many types of fonts and characters,complex text background and so on.This paper focuses on the"Chinese street view"image,and proposes a segmentation free,end-to-end Chinese scene text recognition method based on crnn model.Firstly,CNN extracts image convolution features,and then RNN performs sequence feature prediction.Bi Gru can effectively suppress gradient disappearance or gradient explosion,dropout can prevent over fitting.Finally,CTC is introduced as a loss function to solve the problem that characters cannot be aligned during training.In this paper,Python is used to implement the algorithm,and the experiment is completed with good effect.

作者辜双佳栗智 Gu Shuangjia;Li Zhi(School of Computer Science and Engineering,Chongqing University of Technology,Chongqing 400000;School of Computer Science,Chongqing University,Chongqing 400000)

机构地区重庆理工大学计算机科学与工程学院重庆大学

出处《科技风》 2021年第17期108-110,共3页

关键词中文OCR CRNN 免分割端到端中国街景 Chinese OCR CRNN No split End-to-End Chinese street scene

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献5

1赵逸群,刘富,康冰.基于车牌检测的前方车辆识别方法[J].吉林大学学报（信息科学版）,2019,37(2):168-173. 被引量：7
2白翔,杨明锟,石葆光,廖明辉.基于深度学习的场景文字检测与识别[J].中国科学：信息科学,2018,48(5):531-544. 被引量：35
3杜薇,周武能.基于CTC模型的无分割文本验证码识别[J].计算机与现代化,2018(9):48-51. 被引量：8
4陈强,吴锴,柏云涛.基于深度学习的车牌识别系统开发研究[J].现代计算机,2019,25(35):63-66. 被引量：3
5石鑫,董宝良,王俊丰.基于CRNN的中文手写识别方法研究[J].信息技术,2019,43(11):141-144. 被引量：6

二级参考文献13

1张丽静,孙杰,殷晓宇.基于HSV颜色空间的车牌定位方法[J].微计算机信息,2008(7):247-248. 被引量：22
2付强,丁晓青,蒋焰.基于多信息融合的中文手写地址字符串切分与识别[J].电子与信息学报,2008,30(12):2916-2920. 被引量：7
3朱晓云,徐贵宝.利用语音技术实现互联网信息无障碍[J].电信网技术,2010(1):46-49. 被引量：3
4孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：619
5王斌君,王靖亚,杜凯选,韩宇.验证码技术的攻防对策研究[J].计算机应用研究,2013,30(9):2776-2779. 被引量：19
6郭捷,施鹏飞.基于颜色和纹理分析的车牌定位方法[J].中国图象图形学报（A辑）,2002,7(5):472-476. 被引量：145
7Yingying ZHU,Cong YAO,Xiang BAI.Scene text detection and recognition： recent advances and future trends[J].Frontiers of Computer Science,2016,10(1):19-36. 被引量：21
8卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：551
9金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.深度学习在手写汉字识别中的应用综述[J].自动化学报,2016,42(8):1125-1141. 被引量：109
10汤奕,陈倩,李梦雅,王琦,倪明,梁云.电力信息物理融合系统环境中的网络攻击研究综述[J].电力系统自动化,2016,40(17):59-69. 被引量：216

共引文献53

1Minghui LIAO,Boyu SONG,Shangbang LONG,Minghang HE,Cong YAO,Xiang BAI.SynthText3D:synthesizing scene text images from 3D virtual worlds[J].Science China(Information Sciences),2020,63(2):65-78. 被引量：2
2姚砺,王昭丽.基于深度学习的驾驶证识别方法研究[J].智能计算机与应用,2020,10(7):40-43. 被引量：4
3闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：8
4戎力,刘阳,马强,何春俐,杨蕾,侯冬华.应用多媒体CAI提高口腔修复学教学效率[J].北京口腔医学,2000,8(1):41-42. 被引量：4
5冯谦,陶青川.基于EAST与CNN的钢材表面字符检测与识别方法[J].现代计算机,2019,25(9):71-74. 被引量：3
6郑伊,齐冬莲,王震宇.候选框密度可变的YOLO网络国际音标字符识别方法[J].计算机应用,2019,39(6):1675-1679.
7石鑫,董宝良,王俊丰.基于CRNN的中文手写识别方法研究[J].信息技术,2019,43(11):141-144. 被引量：6
8林国聪,王冬青,薛斌强,刘金燕.基于彩色图像信息的车牌自动识别系统仿真研究[J].青岛大学学报（工程技术版）,2019,34(4):24-28. 被引量：8
9余萍,曹洁.深度学习在故障诊断与预测中的应用[J].计算机工程与应用,2020,56(3):1-18. 被引量：60
10艾合麦提江·麦提托合提,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.基于深度学习的场景文字检测与识别综述[J].电视技术,2019,43(14):65-70. 被引量：2

同被引文献35

1王阳,李振东,杨观赐.基于深度学习的OCR文字识别在银行业的应用研究[J].计算机应用研究,2020,37(S02):375-379. 被引量：21
2康雪玮,于文雅,谭钧恺,邓超,巩红晖,夏辉.基于深度学习的债券图表数据光学字符识别(OCR)检测与文本识别的应用[J].办公自动化,2021,26(14):54-58. 被引量：11
3李蓉.一个用于OCR输出的中文文本的拼写校对系统[J].中文信息学报,2009,23(5):92-97. 被引量：3
4马旭,王淑丽.基于Flask框架的展示型网站的设计与实现[J].数字技术与应用,2018,36(11):137-138. 被引量：10
5郭强,林盛梅.基于SSD的船名检测方法研究[J].中国水运（下半月）,2019,19(4):63-64. 被引量：1
6李兆桐,孙浩云.基于全卷积神经网络的船舶检测和船牌识别系统[J].计算机与现代化,2019,0(12):72-77. 被引量：5
7张婷婷,马明栋,王得玉.OCR文字识别技术的研究[J].计算机技术与发展,2020,30(4):85-88. 被引量：52
8刘丽媛,刘宏展.复杂背景下仪表信息的图像识别研究[J].激光杂志,2020,41(4):66-69. 被引量：14
9吴书楷,刘宝龙,徐舒畅,李毅,吴双卿,张三元,叶修梓.结合深度特征迁移与融合的两阶段船牌定位算法[J].计算机辅助设计与图形学学报,2020,32(4):628-634. 被引量：4
10邓斌权,李剑波,瞿先超.基于云开发和微信小程序的垃圾分类系统实现[J].电脑知识与技术,2020,16(7):82-84. 被引量：18

引证文献4

1耿玲娜,王磊,赵肖旭,巴宇,马海薇.基于OCR的全业务智能辅助平台建设方案[J].电工技术,2022(12):139-141.
2刘颖,赵杨.基于小程序云开发的GS垃圾分类系统设计[J].价值工程,2022,41(29):136-139. 被引量：1
3丁东平,李海涛.基于DP-DBNet和MHA-CRNN的船牌号检测与识别[J].计算机系统应用,2023,32(3):209-216. 被引量：1
4吴宪传,杨敏儿.基于深度学习的车牌图像识别数据可视化平台的设计与实现[J].现代计算机,2023,29(22):75-82.

二级引证文献2

1陈志能,潘威华,林俊楷,何韦颖,谭景辉.基于图像识别的智能垃圾分类系统设计与实现[J].信息与电脑,2023,35(8):136-139. 被引量：3
2方立,严金平,吕果琳,吴雪连,李异.基于深度学习的智慧档案关键信息自动识别技术研究[J].电子元器件与信息技术,2023,7(12):75-78. 被引量：1

1杜训祥.基于卷积神经网络的图像中文OCR识别纠错方法及系统的研究[J].江苏通信,2021,37(1):109-112. 被引量：6
2翟一鸣,王斌君,周枝凝,仝鑫.面向文本分类的多头注意力池化RCNN模型[J].计算机工程与应用,2021,57(12):155-160. 被引量：6
3纪梅.现代城市景观与诗人的自我认同[J].青年文学,2021(6):131-137.
4张海威,张雪妍,张铁军,王睿昕.留学生识字量表编制研究[J].世界汉语教学,2021(1):126-142. 被引量：6
5王官军,罗昌霞,汪龙,宋晔娜,唐祖胜,杨雪君.基于一维卷积神经网络的心肌梗死诊断研究[J].中国数字医学,2021,16(5):55-59.
6车昱娇,陈云霞,崔宇轩.KPCA和改进LSTM在滚动轴承剩余寿命预测中的应用研究[J].电子测量与仪器学报,2021,35(2):109-114. 被引量：17
7刘牧,杨强,刘泽栋,王晋.核电企业基于新一代信息技术的会计管理智能化应用模式研究[J].中国总会计师,2021(5):30-33. 被引量：2
8黎叔,无.CTCC再出发 2021赛季CTCC首站上海揭幕[J].汽车之友,2021(12):86-89.
9夏浩杰,肖剑,盛亮.基于忆阻脉冲耦合神经网络的图像边缘检测[J].软件导刊,2021,20(6):225-229. 被引量：1
10谭志健,沈展涛,黄有星,陈桂豪,陈彦辰,仇成江,刘一峰,吴祥,张生,刘张苑珠,朱春宝,钟小生.原位腹腔镜胰十二指肠切除术[J].岭南现代临床外科,2021,21(2):146-150. 被引量：3

科技风

2021年第17期

浏览历史

内容加载中请稍等...

基于CRNN模型的中文场景文字识别被引量：4

参考文献5

二级参考文献13

共引文献53

同被引文献35

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CRNN模型的中文场景文字识别 被引量：4

参考文献5

二级参考文献13

共引文献53

同被引文献35

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于CRNN模型的中文场景文字识别被引量：4