基于改进YOLOv3的快速文本检测被引量：4

Fast Text Detection Based on Improved YOLOv3

下载PDF

导出

摘要针对深度学习文本检测算法存在运行速度慢、模型体积大等问题,提出了基于改进的YOLOv3(You Only Look Once v3)文本检测方法(mobile-text-YOLOv3)。通过深度可分离卷积思想轻量化Darknet-53网络,在高层特征借助双线性插值和偏移层使卷积核具有可变感受野,较大地改善了模型的性能;改进D-IOU,引入宽度惩罚,改善了锚框(anchor)在垂直方向稀疏和回归目标形状时不平衡的问题,提高了检测精度。实验结果表明,该改进算法精度比YOLOv3提高7个百分点,检测速度最高可达22 frame/s,与同类算法相比有更快的检测速度和更小的模型体积。 To solve the problems of the deep learning text detection algorithm such as slow running speed and large model size,an improved You Only Look Once v3(YOLOv3)text detection method(mobile-text-YOLOv3)is proposed.With the help of deep separable convolution thought and light Darknet-53 network,the convolution kernel has a variable receptive field with the help of bilinear interpolation and offset layer in the high-level features,which greatly improves the performance of the model.D-IOU is improved and width penalty is introduced to improve the imbalance problem of anchor frame when it is sparse in the vertical direction and returns to the target shape,thus improving the detection accuracy.The experimental results show that the improved algorithm improves the accuracy by 7 percentage points compared with YOLOv3.The maximum detection speed of the interferometer is 22 frames per second.Compared with similar algorithms,the improved algorithm has faster detection speed and smaller model size.

作者王霏黄俊文洪伟 WANG Fei;HUANG Jun;WEN Hongwei(School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学通信与信息工程学院

出处《电讯技术》北大核心 2022年第1期130-137,共8页 Telecommunication Engineering

基金国家自然科学基金资助项目(61671095)。

关键词自然场景文本检测深度可分离卷积可变形卷积 natural scenes text detection depth separable convolution deformable convolution

分类号 TN911 [电子电信—通信与信息系统] TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赖叶静,郝珊锋,黄定江.深度神经网络模型压缩方法与进展[J].华东师范大学学报（自然科学版）,2020(5):68-82. 被引量：10
2马巧梅,王明俊,梁昊然.复杂场景下基于改进YOLOv3的车牌定位检测算法[J].计算机工程与应用,2021,57(7):198-208. 被引量：21
3王一婷,张柯,李捷,郝宗波,段昶,朱策.同一场景下超大尺度差异物体的识别和定位方法[J].计算机应用,2020,40(12):3520-3525. 被引量：3

二级参考文献11

1赵伟,鞠美玉,邓艳.复杂环境下的车牌定位方法[J].计算机工程与设计,2016,37(4):982-987. 被引量：7
2雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
3杨鼎鼎,陈世强,刘静漪.基于车牌背景和字符颜色特征的车牌定位算法[J].计算机应用与软件,2018,35(12):216-221. 被引量：28
4蔡瑞初,钟椿荣,余洋,陈炳丰,卢冶,陈瑶.面向“边缘”应用的卷积神经网络量化与压缩方法[J].计算机应用,2018,38(9):2449-2454. 被引量：18
5陈宏照,谢正光,卢海伦.颜色与边缘纹理相结合的车牌定位方法[J].现代电子技术,2018,41(21):67-70. 被引量：15
6李江昀,赵义凯,薛卓尔,蔡铮,李擎.深度神经网络模型压缩综述[J].工程科学学报,2019,41(10):1229-1239. 被引量：42
7晏世武,罗金良,严庆.基于改进Yolov3的目标检测的研究[J].智能计算机与应用,2019,9(6):312-315. 被引量：4
8艾曼.基于Faster-RCNN的车牌检测[J].计算机与数字工程,2020,48(1):174-177. 被引量：10
9孔方方,宋蓓蓓.改进YOLOv3的全景交通监控目标检测[J].计算机工程与应用,2020,56(8):20-25. 被引量：25
10王兵,李文璟,唐欢.改进YOLO v3算法及其在安全帽检测中的应用[J].计算机工程与应用,2020,56(9):33-40. 被引量：51

共引文献31

1张颖君,陈恺,周赓,吕培卓,刘勇,黄亮.神经网络水印技术研究进展[J].计算机研究与发展,2021,58(5):964-976. 被引量：8
2许冠,詹金峰.基于YOLOv3改进的手势检测算法[J].机电工程技术,2021,50(6):1-5. 被引量：2
3江祥奎,刘洵,李红.基于改进YOLOv3网络的车牌检测算法[J].西安邮电大学学报,2021,26(3):66-72. 被引量：3
4任国强,韩洪勇,李成江,尹燕芳.基于Fast_YOLOv3算法的煤矿胶带运输异物检测[J].工矿自动化,2021,47(12):128-133. 被引量：13
5舒志旭.基于注意力机制的车牌快速检测方法研究[J].光电子．激光,2021,32(12):1313-1322. 被引量：4
6焦爽,范亚冰,孙立群,丁小龙.基于深度细节加强网络模型的去雨方法研究[J].电脑知识与技术,2021,17(35):80-84.
7孙东来,王继超,陈科,孙士尉,刘昕彤,周闻天.基于Ghost-YOLOv3-2算法的2尺度猪目标检测[J].江苏农业科学,2022,50(7):189-196. 被引量：4
8高艳,刘海峰.基于OpenCV和卷积神经网络的车牌识别研究[J].软件工程,2022,25(5):23-25. 被引量：7
9张国鹏,陈学斌,马征.基于知识蒸馏的目标检测分析[J].软件导刊,2022,21(5):24-29. 被引量：1
10张丽莹,庞春江,王新颖,李国亮.基于改进YOLOv3的多尺度目标检测算法[J].计算机应用,2022,42(8):2423-2431. 被引量：8

同被引文献41

1朱江,李华健.基于YOLOv3的抓取检测网络[J].信息化研究,2022,48(1):19-24. 被引量：1
2刘迦南,朱洋,李艺嘉,韩婧.基于LIBSVM的烟青虫成虫雌雄判别研究[J].粮食科技与经济,2018,43(9):117-119. 被引量：6
3周翔宇,高仲合.基于YOLO的自然场景倾斜文本定位方法研究[J].计算机工程与应用,2020,56(9):213-220. 被引量：5
4刘燕,温静.基于注意力机制的复杂场景文本检测[J].计算机科学,2020,47(7):135-140. 被引量：6
5孙光民,关世奎,李煜,郑鲲,刘军华.基于改进CTPN算法的试卷手写文本检测[J].信息技术,2020,44(9):94-98. 被引量：6
6陈淼妙,续晋华.基于高分辨率卷积神经网络的场景文本检测模型[J].计算机应用与软件,2020,37(10):138-144. 被引量：4
7苏轶君.基于高分遥感影像的泥石流潜在形成区识别方法探讨[J].中国地质灾害与防治学报,2020,31(5):22-31. 被引量：3
8李煌,王晓莉,项欣光.基于文本三区域分割的场景文本检测方法[J].计算机科学,2020,47(11):142-147. 被引量：8
9王辉,张帆,刘晓凤,李潜.基于DarkNet-53和YOLOv3的水果图像识别[J].东北师大学报（自然科学版）,2020,52(4):60-65. 被引量：22
10袁星星,吴秦.基于显著性特征和角度信息的遥感图像目标检测[J].计算机科学,2021,48(4):174-179. 被引量：8

引证文献4

1冉煜,张莉.R-YOLOv5:自动切割的旋转的文本检测模型[J].计算机科学,2022,49(S02):637-642.
2武珊.融合聚类算法与YOLO-v3网络在果蔬种植防虫害中的应用研究[J].江西农业学报,2022,34(10):108-115.
3孙巧榆,张静,刘珍兵.基于改进YOLOv5的快速水平文本检测算法[J].江苏海洋大学学报（自然科学版）,2024,33(1):75-81.
4王非凡,陈希爱,任卫红,管宇,韩志,唐延东.基于图像自适应增强的低照度目标检测算法[J].计算机工程,2024,50(10):352-361.

1缪伟志,陆兆纳,王俊龙,王焱.基于视觉的火灾检测研究[J].森林工程,2022,38(1):86-92. 被引量：14
2王朝辉,王润哲,郭震冬,黄亮.基于YOLO的街景影像中行人车辆检测方法[J].北京测绘,2021,35(11):1452-1455. 被引量：2
3邱飞岳,孔德伟,张志勇,章国道.一种嵌入并行通道蓝图分离卷积的图像分类算法[J].小型微型计算机系统,2021,42(12):2592-2599.
4Yusef KIANPOOR KALKHAJEH,Biao HUANG,Helle SORENSEN,Peter EHOLM,Hans Christian BHANSEN.Phosphorus accumulation and leaching risk of greenhouse vegetable soils in Southeast China[J].Pedosphere,2021,31(5):683-693. 被引量：6
5安然.农历新年出圈指南[J].时尚北京,2022(2):30-33.
6彭继慎,孙礼鑫,王凯,宋立业.基于模型压缩的ED-YOLO电力巡检无人机避障目标检测算法[J].仪器仪表学报,2021,42(10):161-170. 被引量：76
7魏兵海,魏蓝云天.智慧社区教育的微信云服务平台建设[J].微型电脑应用,2022,38(1):45-47. 被引量：4
8Huadong Guo,Editor-in-Chief.EDITORIAL[J].International Journal of Digital Earth,2011,4(1):1-1.
9汉译英参考译文:Spring Outing and Drowning[J].中国翻译,2021,42(6):181-182.
10Acknowledgments to Reviewers 2020[J].Genomics, Proteomics & Bioinformatics,2021,19(1):168-170.

电讯技术

2022年第1期

浏览历史

内容加载中请稍等...

基于改进YOLOv3的快速文本检测被引量：4

参考文献3

二级参考文献11

共引文献31

同被引文献41

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进YOLOv3的快速文本检测 被引量：4

参考文献3

二级参考文献11

共引文献31

同被引文献41

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于改进YOLOv3的快速文本检测被引量：4