基于特征融合网络的自然场景文本检测被引量：3

Scene Text Detection Based on Feature Fusion Network

下载PDF

导出

摘要目前,基于深度学习的自然场景文本检测在复杂的背景下取得很好的效果,但难以准确检测到小尺度文本.本文针对此问题提出了一种基于特征融合的深度神经网络,该网络将传统深度神经网络中的高层特征与低层特征相融合,构建一种高级语义的神经网络.特征融合网络利用网络高层的强语义信息来提高网络的整体性能,并通过多个输出层直接预测不同尺度的文本.在ICDAR2011和ICDAR2013数据集上的实验表明,本文的方法对于小尺度的文本,定位效果显著.同时,本文所提的方法在自然场景文本检测中具有较高的定位准确性和鲁棒性, F值在两个数据集上均达到0.83. At present, scene text detection based on deep learning has achieved good performance in complex background.However, it is difficult to precisely detect text with small scale. To solve this problem, this study proposes a deep neural network based on feature fusion, and a new neural network with senior semantic is constructed by combining the highlevel feature and low-level feature of traditional deep neural network. Strong semantic information of the high layer network is utilized to improve the overall performance of the neural network, and the feature fusion network directly predicts text with multiple scales through multiple output layers. Experimental results on ICDAR2011 and ICDAR2013 datasets show that proposed method is significantly effective in detecting small scale text. Meanwhile, the proposed method has high accuracy and robustness in scene text detection, and the F-measure achieves 0.83 on both datasets.

作者余峥王晴晴吕岳 YU Zheng;WANG Qing-Qing;LYU Yue(School of Computer Science and Software Engineering,East China Normal University,Shanghai 200062,China)

机构地区华东师范大学计算机科学与软件工程学院

出处《计算机系统应用》 2018年第10期1-10,共10页 Computer Systems & Applications

基金上海市自然科学基金(17ZR1408200)~~

关键词深度学习自然场景文本检测特征融合文本边界框 deep learning natural scene text detection feature fusion text bounding boxes

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1陈利.车牌识别系统设计与实现[J].现代电子技术,2012,35(15):142-144. 被引量：5
2胡二雷,冯瑞.基于深度学习的图像检索系统[J].计算机系统应用,2017,26(3):8-19. 被引量：21
3王琦,陈临强,梁旭.视频中的字幕提取[J].计算机工程与应用,2012,48(5):177-178. 被引量：6
4易尧华,申春辉,刘菊华,卢利琼.结合MSCRs与MSERs的自然场景文本检测[J].中国图象图形学报,2017,22(2):154-160. 被引量：18

二级参考文献15

1王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
2王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
3陈振学,汪国有,刘成云.一种新的车牌图像字符分割与识别算法[J].微电子学与计算机,2007,24(2):42-44. 被引量：16
4章毓晋.图像处理和分析技术[M].北京:高等教育出版社,2008.
5Anh-Nga L, Gueesang L.Binarization by local K-means clustering for Korean text extraction[C]//IEEE International Symposium on Signal Processing and Information Technology, ISSPIT 2008, 2008:117-122.
6Yaowen Z, Weiqiang W, Wen G.A robust split-and-merge text segmentation approach for images[C]//18th International Conference on Pattern Recognition, ICPR 2006,2006:1002-1005.
7Lienhart R, Wernicke A.Loealizing and segmenting text in images and videos[J].IEEE Transactions on Circuits and Systems for Video Technology, 2002,12 (4) : 256-268.
8CHANG S L, CHEN L S, CHUNG Y C, et al. Automatic license plate recognition [J]. IEEE Transactions on Intelli- gent Transportation System, 2004, 5(1): 42-53.
9秦襄培,郑贤中.Madab图像处理宝典[M].北京:电子工业出版社,2011.
10DOUGHERTY E R. Introduction to morphological image processing [M]. Bellingham: SPIE, 1992.

共引文献46

1易尧华,何婧婧,卢利琼,汤梓伟.顾及目标关联的自然场景文本检测[J].中国图象图形学报,2020,0(1):126-135. 被引量：14
2黄仕凰,蔡燕敏.汽车4S店呼叫中心与车牌识别一体化解决方案研究[J].现代电子技术,2013,36(10):102-105. 被引量：1
3冯媛媛,张武江.网络公开课字幕翻译策略浅析[J].沈阳工程学院学报（社会科学版）,2014,10(2):230-233. 被引量：4
4王超,刘宇.基于Photoshop批处理的播出标识文件快速生产方法[J].电视技术,2014,38(12):92-95.
5季丽琴.基于CEMA的视频文字提取与背景修复[J].智能计算机与应用,2015,5(3):113-115. 被引量：1
6陈晓兰,罗晓娟,黄俊腾,田亮.一种基于VC++的智能车牌识别系统[J].内江科技,2015,36(8):54-55.
7李孟格,隋清臣,王佳宇.车牌识别系统设计与实现[J].电子世界,2015(14):184-186. 被引量：1
8沈羽,李季.一种汽车维修社区店的车牌识别系统应用解决方案[J].现代制造技术与装备,2017,53(12):169-170.
9张水利,汪恒,李蓓茹,聂栋梁.融合贝叶斯和FSRM的相关反馈算法研究[J].网络新媒体技术,2018,7(1):22-26.
10郭升挺,黄晞,柯俊敏,陈宝林,吴家飞,苏浩明.基于深度学习与拓展查询的商标图像检索方法[J].网络新媒体技术,2018,7(1):33-39. 被引量：5

同被引文献31

1颜宏文,陈金鑫.基于改进YOLOv3的绝缘子串定位与状态识别方法[J].高电压技术,2020,46(2):423-432. 被引量：79
2戴津.自然场景中文本检测技术研究综述[J].计算机光盘软件与应用,2013,16(18):104-104. 被引量：3
3王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：55
4尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：385
5卓力,龙海霞,彭远帆,李晓光,张菁.加密域图像处理综述[J].北京工业大学学报,2016,42(2):174-183. 被引量：3
6陈洋,范荣双,王竞雪,陆婉芸,朱红,楚清源.基于深度学习的资源三号卫星遥感影像云检测方法[J].光学学报,2018,38(1):354-359. 被引量：56
7陶攀,付忠良,朱锴,王莉莉.基于深度学习的医学计算机辅助检测方法研究[J].生物医学工程学杂志,2018,35(3):368-375. 被引量：5
8蒋强,沈林,张伟,何旭.基于深度学习的故障诊断方法研究[J].计算机仿真,2018,35(7):409-413. 被引量：15
9闫春江,王闯,方华林,王毅轩,杜觉晓,项学智,郭鑫立.基于深度学习的输电线路工程车辆入侵检测[J].信息技术,2018,42(7):28-33. 被引量：10
10黄新波,张慧莹,张烨,刘新慧,邢晓强,杨璐雅.基于改进色差法的复合绝缘子图像分割技术[J].高电压技术,2018,44(8):2493-2500. 被引量：33

引证文献3

1白志程,李擎,陈鹏,郭立晴.自然场景文本检测技术研究综述[J].工程科学学报,2020,42(11):1433-1448. 被引量：13
2陈金生.基于深度学习的无线融断网络威胁环境自适应检测方法[J].电子设计工程,2021,29(16):83-86.
3周宇,徐波,宋爱国,陈格格.基于改进文本检测识别的绝缘子串异常定位和判别方法[J].高电压技术,2021,47(11):3819-3826. 被引量：9

二级引证文献22

1翟永杰,王璐瑶,郭聪彬.基于Faster R-CNN的复杂背景下绝缘子目标检测[J].电子测量技术,2023,46(16):187-194. 被引量：3
2孟月波,石德旺,刘光辉,徐胜军,金丹.多维度卷积融合的密集不规则文本检测[J].光学精密工程,2021,29(9):2210-2221. 被引量：6
3胡巧遇,仝明磊.基于高斯密度图估计的自然场景汉字检测[J].计算机应用研究,2022,39(2):623-627. 被引量：2
4王明宇.基于深度学习的自然场景多方向文本检测与识别[J].电子技术与软件工程,2021(24):93-96. 被引量：1
5郭婧,周斌.基于OCR的运动员心率图的实现[J].信息技术与信息化,2022(5):29-32.
6王戈,黄浩,汪沛洁,郑昕.基于DBNet和CRNN算法的端到端企业实体识别[J].湖北大学学报（自然科学版）,2022,44(4):481-488. 被引量：1
7王泽,张玉敏,吉兴全,徐波,杨明,韩学山.基于深度学习与内核岭回归的电力系统鲁棒状态估计[J].高电压技术,2022,48(4):1332-1342. 被引量：16
8李斌,曾筠婷,朱新山,王帅,郭志民,刘昊.基于多尺度上下文感知的绝缘子缺陷检测网络[J].高电压技术,2022,48(8):2905-2914. 被引量：10
9蔡玉宝,李德峰,王宁,杜会盈,徐聪.雷达态势图像表格检测与识别[J].指挥控制与仿真,2022,44(6):110-114.
10葛先雷,杨帅斌.基于CNN的手写中文数字识别研究[J].太原师范学院学报（自然科学版）,2022,21(4):53-57. 被引量：1

1赵鹏,王维,刘慧婷,纪霞.基于迁移鲁棒稀疏编码的图像表示方法[J].计算机学报,2017,40(10):2421-2432. 被引量：11
2戴玉静,李辉,张静.基于模糊线段和链码相结合的关键点检测方法[J].工业控制计算机,2018,31(10):77-78.
3陈妮娅,郭宇,钟静弘,郑燕雯,张雅妮.社区老年人怀旧与生活满意度之间的关系:希望的中介作用[J].新余学院学报,2018,23(5):43-46. 被引量：4
4廖梦怡,陈靓影,徐如意,皇富强.灰度值星型辐射投影角点检测算法[J].计算机辅助设计与图形学学报,2018,30(11):2141-2149. 被引量：4
5沈丽丽,彭科.基于小波包分解的无参考立体图像质量评价[J].湖南大学学报（自然科学版）,2018,45(10):139-147. 被引量：2
6李书清.卷积神经网络模型分析[J].无线互联科技,2018,15(19):41-43. 被引量：3
7雷红.新时代提升高校思想政治工作实效性的着力点——学习贯彻习近平总书记思想政治工作系列重要讲话精神[J].赤峰学院学报（哲学社会科学版）,2018,39(10):116-120. 被引量：6
8宋立飞,翁理国,汪凌峰,夏旻.多尺度输入3D卷积融合双流模型的行为识别方法[J].计算机辅助设计与图形学学报,2018,30(11):2074-2083. 被引量：10
9张安琪.基于孪生卷积神经网络与三元组损失函数的图像识别模型[J].电子制作,2018,26(21):49-50. 被引量：2
10张霞,郑逢斌.基于多层次视觉语义特征融合的图像检索算法[J].包装工程,2018,39(19):223-232. 被引量：4

计算机系统应用

2018年第10期

浏览历史

内容加载中请稍等...

基于特征融合网络的自然场景文本检测被引量：3

参考文献4

二级参考文献15

共引文献46

同被引文献31

引证文献3

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于特征融合网络的自然场景文本检测 被引量：3

参考文献4

二级参考文献15

共引文献46

同被引文献31

引证文献3

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于特征融合网络的自然场景文本检测被引量：3