基于YOLOv3与CRNN的自然场景文本识别被引量：8

Text detection in natural scenes based on YOLOv3 and CRNN

下载PDF

导出

摘要在自然场景中对中英文文本的检测与识别受限于图像本身包含的噪声数据,为提高检测识别效率,提出基于YOLOv3与CRNN的自然场景文本识别方法。进行文本角度预测,根据角度预测值旋转图像;采用YOLOv3文本区域检测算法计算若干组固定宽度的文本框;使用聚类算法将这些固定宽度的文本框连接成一个包含完整语义的文本框;采用CRNN算法识别文本检测框中的文本。实验结果表明,YOLOv3与CRNN模型识别100幅图像用时0.4258 s,在同等实验环境中CTPN与DenseNet模型用时0.8250 s,验证了YOLOv3与CRNN模型比CTPN与DenseNet模型具有更高的识别效率。 The detection and recognition of Chinese and English text in natural scene is limited by the noise data contained in the image itself.To improve the efficiency of detection and recognition,a natural scene text recognition method based on YOLOv3 and CRNN was proposed.The text angle was predicted,and the image was rotated according to the angle predicted value.YOLOv3 text region detection algorithm was used to calculate several groups of text boxes with fixed width.These fixed width text boxes were connected into a text box containing complete semantics using clustering algorithm,and the CRNN algorithm was used to identify the text in the text detection box.Experimental results show that YOLOv3 and CRNN model can identify 100 images in 0.4258 s.In the same experimental environment,the time cost of CTPN and DenseNet model is 0.8250 s,which verifies that YOLOv3 and CRNN models have higher recognition efficiency than CTPN and DenseNet models.

作者吴启明宋雨桐 WU Qi-ming;SONG Yu-tong(College of Computer and Information Engineering,Hechi University,Yizhou 546300,China;School of Computer Science and Technology,Huazhong University of Science and Technology,Wuhan 430074,China)

机构地区河池学院计算机与信息工程学院华中科技大学计算机科学与技术学院

出处《计算机工程与设计》北大核心 2022年第8期2352-2360,共9页 Computer Engineering and Design

基金国家自然科学基金项目(61672254) 广西自然科学基金项目(2012GXNSFBA220023、2020GXNSFAA159172)。

关键词深度学习文字识别自然场景卷积递归神经网络文字角度预测 deep learning text recognition natural scenes CRNN text angle prediction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献72

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：8
2黄辉,肖豪,王琼瑶,吴建强,梁志龙.基于改进YOLOv5与CRNN的电表示数识别[J].电子测量技术,2023,46(1):173-180. 被引量：2
3卫薇,龙娜,田钺,康博,王道累,赵文彬.基于改进DBNet的电力设备铭牌文本检测方法研究[J].高电压技术,2023,49(S01):63-67. 被引量：2
4王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：51
5陈爱霞,杜友福,陈中举.图像识别的应用现状和研究方向[J].中国科技信息,2015,0(16):82-82. 被引量：9
6陶莉,朱小光,王善红.使用二维码识别的电力设备巡视系统设计[J].电气技术,2016,17(4):119-122. 被引量：20
7李军锋,王钦若,李敏.结合深度学习和随机森林的电力设备图像识别[J].高电压技术,2017,43(11):3705-3711. 被引量：100
8楚瀛,李帅奇.基于联合特征的变电站设备图像识别[J].电力科学与技术学报,2018,33(1):102-107. 被引量：17
9陈晓龙,陈显龙,袁建平,高宇豆,张加其.基于深度学习的电力设备铭牌识别[J].广西大学学报（自然科学版）,2018,43(6):2216-2226. 被引量：15
10黄继鹏,史颖欢,高阳.面向小目标的多尺度Faster-RCNN检测算法[J].计算机研究与发展,2019,56(2):319-327. 被引量：90

引证文献8

1房小绵.基于语音识别的英语智能对话机器人人机交互系统设计[J].自动化与仪器仪表,2023(4):225-228. 被引量：6
2李欢欢,徐小云,王红蕾.CTPN在快递单文字检测中的应用研究[J].科技资讯,2023,21(15):58-61.
3高尚,李艳玲,葛凤培,林民.基于改进卷积神经网络的身份证信息识别[J].计算机工程与设计,2023,44(11):3447-3454.
4张蝶依.基于深度学习的自然场景文本检测与识别研究[J].移动信息,2024,46(6):245-247.
5刘轩溢.基于DBNet和改进的Trie树搜索的网络敏感词检测技术[J].自动化与仪器仪表,2024(5):25-28. 被引量：1
6郑安刚,张天宜,杨玉博,尚怀嬴,任毅.基于智慧计量实验室的多源异构检测数据智能提取技术研究[J].电测与仪表,2024,61(8):70-77.
7常荣,唐力.基于监督和卷积循环神经网络算法的电力设备铭牌识别技术[J].电子器件,2024,47(4):1027-1032.
8张纯,刘从军.基于卷积神经网络和残差结构单元的合同数据识别提取[J].软件工程,2024,27(11):32-37.

二级引证文献7

1贾丹妮.基于传感器技术的情绪采集与电子音乐交互实现[J].自动化与仪器仪表,2024(2):242-245.
2郭欢,石岩松,吴桐,卫艺冉,范作阳.大语言模型在ROS机器人语音交互上的实践与应用[J].微型计算机,2024(4):34-36.
3田野,刘公政,周钦山.基于语音识别的信号分析仪控制系统设计与实现[J].电声技术,2024,48(8):54-57.
4王亚欣,张蓓蓓.基于AI的电力智能调度语音识别交互系统设计[J].通信电源技术,2024,41(18):73-75.
5王锦.基于改进1DCNN的英语语音识别人机交互系统设计[J].电子产品世界,2024,31(9):36-38.
6付默予.电力系统智能调度中语音人机交互技术[J].电子设计工程,2024,32(21):132-136.
7邓又琦,张明,马敬济.基于深度学习识别算法的文件敏感词多维度检测技术研究[J].计算机与数字工程,2024,52(8):2435-2439.

1胡瑢华,姚圣,曾成.面向康复训练的多通道mRMR-PSO肌电特征选择算法[J].电子测量技术,2022,45(11):72-77. 被引量：2
2龚读,景航,李聪,聂振康,冯川,周浩.基于神经网络的金属零件表面字符检测与识别技术研究[J].计算机科学与应用,2022,12(6):1631-1640.
3郑承宇,王新,王婷,邓亚萍,尹甜甜.基于ALBERT-TextCNN模型的多标签医疗文本分类方法[J].山东大学学报（理学版）,2022,57(4):21-29. 被引量：12
4何平,张恒,刘成林.基于多尺度注意力机制的场景文本擦除[J].模式识别与人工智能,2022,35(7):614-624.
5赵凤兰.小学英语连词成句策略——基于句法范畴理论[J].中小学英语教学与研究,2022(3):25-27.
6Hengyang Wang,Jin Liu,Haoliang Ren.CTSF:An End-to-End Efficient Neural Network for Chinese Text with Skeleton Feature[J].Journal on Big Data,2021,3(3):119-126.

计算机工程与设计

2022年第8期

浏览历史

内容加载中请稍等...

基于YOLOv3与CRNN的自然场景文本识别被引量：8

同被引文献72

引证文献8

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于YOLOv3与CRNN的自然场景文本识别 被引量：8

同被引文献72

引证文献8

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于YOLOv3与CRNN的自然场景文本识别被引量：8