面向视频数据的深度学习目标识别算法综述被引量：11

Survey of Target Recognition Algorithms for Video Data Using Deep Learning

下载PDF

导出

摘要目标识别是计算机视觉领域的一大挑战,随着深度学习的发展,目标识别算法被广泛应用于视频数据中目标的识别和监测。对现有目标识别算法进行归纳,根据是否采用锚点机制将主流算法分为Anchor-Based和Anchor-Free两大类。针对R-CNN、SPP-Net、SSD、YOLOv2等Anchor-Based类目标识别算法,从候选框创建、特征提取和结果生成角度分析基于区域和基于回归的目标识别算法的区别和各自优势。针对CornerNet、ExtremeNet、CenterNet、FCOS等Anchor-Free类目标识别算法,从特征提取、关键点选择/层次结构和结果生成角度分析基于关键点和基于特征金字塔的目标识别算法的区别和各自优势。在此基础上,以识别效率和识别精度为评价指标,对Faster R-CNN、Mask R-CNN、SSD等8种代表性目标识别算法进行对比总结。最后,针对目标识别算法中的数据预处理耗时长、多尺度特征同步识别精度低、结构繁杂等问题,对当前研究的不足和未来研究方向进行分析和展望。 Target recognition is a big challenge in the field of computer vision.With the development of deep learning,target recognition algorithms are widely used to monitor video data.The existing target recognition algorithms can be summarized based on the existence of the anchor mechanism such that target recognition algorithms are divided into Anchor-Based and Anchor-Free.For Anchor-Based target recognition algorithms,such as R-CNN,SPP Net,SSD and YOLOv2,the differences and respective advantages of region-based and regression-based target recognition algorithms are analyzed from the perspective of creating candidate boxes,feature extraction,and result generation.In contrast,for Anchor-Free target recognition algorithms,such as CornerNet ExtremeNet,CenterNet,and FCOS,the differences and respective advantages of key point-based and feature pyramid-based target recognition algorithms are analyzed from the perspectives of feature extraction,key point selection/hierarchy and result generation.This study compares and summarizes eight representative target recognition algorithms,Fast R-CNN,Mask R-CNN and SSD,to name a few,with recognition efficiency and recognition accuracy as evaluation indices.At last,to address the problems of long computation time in data preprocessing,low accuracy of multi-scale feature synchronous recognition,and the complex structure of target recognition algorithms,which are the shortcomings of the current research,future prospects and research directions in analysis are suggested.

作者王振华李静张鑫月郑宗生卢鹏栾奎峰 WANG Zhenghua;LI Jing;ZHANG Xinyue;ZHENG Zongsheng;LU Peng;LUAN Kuifeng(College of Information,Shanghai Ocean University,Shanghai 201306,China;College of Marine Sciences,Shanghai Ocean University,Shanghai 201306,China)

机构地区上海海洋大学信息学院上海海洋大学海洋科学学院

出处《计算机工程》 CAS CSCD 北大核心 2022年第4期1-15,共15页 Computer Engineering

基金国家自然科学基金(61972240) 上海市地方院校能力建设项目(19050502100) 上海市海洋局科研项目(沪海科2020-05)。

关键词深度学习目标识别锚定框候选区域关键点视频数据 deep learning object recognition anchor box region proposal key point video data

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1杨志虎,赵家曼.公共地点人流量统计预警平台[J].智能计算机与应用,2020,10(10):112-114. 被引量：2
2符惠桐,王鹏,李晓艳,吕志刚,邸若海.面向移动目标识别的轻量化网络模型[J].西安交通大学学报,2021,55(7):124-131. 被引量：17
3何伟鑫,邓建球,逯程,丛林虎.联合ACF与YOLOv3的目标识别方法研究[J].兵器装备工程学报,2020,41(11):147-153. 被引量：2
4赵永强,饶元,董世鹏,张君毅.深度学习目标检测方法综述[J].中国图象图形学报,2020,25(4):629-654. 被引量：202
5陈泽,叶学义,钱丁炜,魏阳洋.基于改进Faster R-CNN的小尺度行人检测[J].计算机工程,2020,46(9):226-232. 被引量：21
6陈科圻,朱志亮,邓小明,马翠霞,王宏安.多尺度目标检测的深度学习研究综述[J].软件学报,2021,32(4):1201-1227. 被引量：100
7张震,李孟洲,李浩方,马军强.改进SSD算法及其在地铁安检中的应用[J].计算机工程,2021,47(7):314-320. 被引量：4
8施政,毛力,孙俊.基于YOLO的多模态加权融合行人检测算法[J].计算机工程,2021,47(8):234-242. 被引量：11
9郑秋梅,王璐璐,王风华.基于改进卷积神经网络的交通场景小目标检测[J].计算机工程,2020,46(6):26-33. 被引量：19
10郑婷婷,杨雪,戴阳.基于关键点的Anchor Free目标检测模型综述[J].计算机系统应用,2020,29(8):1-8. 被引量：13

二级参考文献22

1田仙仙,鲍泓,徐成.一种改进HOG特征的行人检测算法[J].计算机科学,2014,41(9):320-324. 被引量：37
2高宗,李少波,陈济楠,李政杰.基于YOLO网络的行人检测方法[J].计算机工程,2018,44(5):215-219. 被引量：80
3焦天驰,李强,林茂松,贺贤珍.结合反残差块和YOLOv3的目标检测法[J].传感器与微系统,2019,38(9):144-146. 被引量：14
4谢林江,季桂树,彭清,罗恩韬.改进的卷积神经网络在行人检测中的应用[J].计算机科学与探索,2018,12(5):708-718. 被引量：45
5邢浩强,杜志岐,苏波.基于改进SSD的行人检测方法[J].计算机工程,2018,44(11):228-233. 被引量：21
6薛丽霞,钟欣,汪荣贵,杨娟,胡敏.基于深度特征融合的中低分辨率车型识别[J].计算机工程,2019,45(1):233-238. 被引量：6
7陈恩加,唐向宏,傅博文.Faster R-CNN行人检测与再识别为一体的行人检索算法[J].计算机辅助设计与图形学学报,2019,31(2):332-339. 被引量：18
8谭红臣,李淑华,刘彬,刘秀平.特征增强的SSD算法及其在目标检测中的应用[J].计算机辅助设计与图形学学报,2019,31(4):573-579. 被引量：34
9刘俊,孟伟秀,余杰,李亚辉,孙乔.面向军事目标识别的DRFCN深度网络设计及实现[J].光电工程,2019,46(4):18-27. 被引量：4
10刘慧,张礼帅,沈跃,张健,吴边.基于改进SSD的果园行人实时检测方法[J].农业机械学报,2019,50(4):29-35. 被引量：32

共引文献384

1程林,柏杨,都昌平,薛翔天,章品正,於文雪,王世杰,陈阳.基于深度学习的X光地铁危险物品检测算法[J].中国体视学与图像分析,2021,26(3):301-309. 被引量：2
2徐哲壮,黄平,陈丹,吴开田,李建坤.融合机器视觉与邻近度估计的相似工业设备识别策略研究[J].仪器仪表学报,2023,44(1):283-290. 被引量：2
3赵朗月,吴一全.基于机器视觉的表面缺陷检测方法研究进展[J].仪器仪表学报,2022,43(1):198-219. 被引量：67
4黎国溥,陈升东,王亮,邹凯,袁峰.基于改进YOLOv5的车辆端目标检测[J].计算机系统应用,2022,31(12):127-134. 被引量：5
5储珺,林文杰,徐鹏.目标检测中特征不匹配问题研究进展[J].南昌航空大学学报（自然科学版）,2021,35(3):1-8. 被引量：2
6王子元,王国中,顾嘉城.改进的YOLOv5算法在安全帽检测的应用[J].智能计算机与应用,2023,13(8):169-174.
7吴奎,向峰,周顺,张雪荣,李红军,张驰.基于改进的YOLOv4-tiny钢卷端面缺陷检测[J].智能计算机与应用,2022,12(3):22-27. 被引量：1
8张兴国,周英迪,石新雨,罗霄月,顾杨旸.一种球机视频全景拼接及空间化方法[J].测绘科学,2022,47(5):203-211. 被引量：1
9孔刘玲,刘秀文.基于改进YOLOv4算法的船舶目标检测方法[J].船舶工程,2022,44(1):96-103. 被引量：10
10陈涛.目标检测在数字人文图像中的应用尝试[J].数字人文研究,2021,1(3):39-50. 被引量：2

同被引文献68

1刘艺航,胡艳歌,王婧琦.电子考场中异常行为的检测与研究[J].中外企业家,2020(2):231-231. 被引量：1
2裴欢,赵伟.南京地铁“安全管理一体化”信息系统建设探讨[J].中国安全生产科学技术,2019,15(S01):26-33. 被引量：15
3钱七虎,戎晓力.中国地下工程安全风险管理的现状、问题及相关建议[J].岩石力学与工程学报,2008,27(4):649-655. 被引量：326
4卢万银,吴红星,任启宏.基于Microwin32的闸门开度测量与纠偏监控系统[J].人民长江,2009,40(16):69-70. 被引量：3
5丁烈云,周诚.复杂环境下地铁施工安全风险自动识别与预警研究[J].中国工程科学,2012,14(12):85-93. 被引量：46
6冯国冠.城市轨道交通工程质量安全管理信息化建设的方案设计[J].中国安全生产科学技术,2012,8(12):74-79. 被引量：30
7韩志伟,刘志刚,张桂南,杨红梅.非接触式弓网图像检测技术研究综述[J].铁道学报,2013,35(6):40-47. 被引量：73
8蔺永政,吴小羽,李恒建,柳忠光.基于背景消减法的考场作弊行为检测方法[J].济南大学学报（自然科学版）,2015,29(6):406-409. 被引量：3
9卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：531
10曹莹,苗志刚.基于向量矩阵优化频繁项的改进Apriori算法[J].吉林大学学报（理学版）,2016,54(2):349-353. 被引量：19

引证文献11

1莫兰蕊,龙涛,李妹燕.基于CiteSpace的卷积神经网络可视化分析研究[J].电脑知识与技术,2022,18(9):63-66. 被引量：1
2冯梦琦,许林铭.基于自动驾驶的快速通过限宽装置系统[J].专用汽车,2022(9):11-14.
3刘雪,陈亚军,马登,彭名杨.基于视线估计的考场作弊检测方法[J].太原师范学院学报（自然科学版）,2022,21(3):47-52.
4吴真真,唐超,杨晓飞.基于深度学习的视频识别及动态监测技术应用——以轨道交通建设工程为例[J].测绘通报,2022(9):23-28. 被引量：8
5李永健,张琦,王亚明,付燕荣.图像处理技术在地铁屏蔽门中的应用[J].信息与电脑,2022,34(15):71-74. 被引量：1
6易俊儒,谌绍林,邓仁丽,朱南希,林晶,江孝川,宋佳美,陈月华,詹昕凌,潘秋丹.基于B/S架构的新生儿疼痛面容图像标注系统研发[J].中国现代医生,2022,60(36):96-100.
7耿德新.基于特征选取的监控运动目标识别模型研究[J].信息记录材料,2023,24(2):22-24.
8李子涵,周省邦,赵戈,张克智,曾倩,吴梦涛.基于卷积神经网络的农业病虫害识别研究综述[J].江苏农业科学,2023,51(7):15-23. 被引量：1
9莫锐,冯飞,李瞳昊.基于深度学习的装车高度检测技术研究[J].现代工程科技,2023,2(4):9-12.
10辛恩承.基于改进YOLOV3算法的受电弓安全状态检测技术研究[J].铁道机车车辆,2024,44(2):94-100.

二级引证文献11

1苏琳,张煦,张瑞红,李卓琼.Mask R-CNN和无人机遥感在黄河“四乱”问题调查中的应用[J].测绘通报,2023(S01):105-110.
2陆坚.基于卷积神经网络的视频烟雾探测追踪技术研究[J].消防科学与技术,2022,41(12):1713-1715.
3耿德新.基于特征选取的监控运动目标识别模型研究[J].信息记录材料,2023,24(2):22-24.
4丁静怡,王凌霄,袁竞峰,薛竣.基于目标识别与姿态检测的套筒灌浆过程监测方法[J].土木工程与管理学报,2023,40(1):136-144.
5杨静,苏朗.城市轨道交通人工智能算法风险识别和控制[J].信息记录材料,2023,24(3):147-149.
6寇亚龙.EPC总承包模式下电气工程项目全过程安全管理研究[J].电器工业,2023(4):66-68. 被引量：1
7程转花,兰葭凌,王亚明,付燕荣.基于PLC的屏蔽门教学系统设计与实现[J].科技与创新,2023(22):5-7. 被引量：1
8李正,李宝喜,李志豪,战艺芳,王利华,龚琦.基于深度学习的农作物病虫害识别研究进展[J].湖北农业科学,2023,62(11):165-169.
9汪琴,罗小华.城市轨道交通线网站台门施工智能管控技术研究[J].现代信息科技,2024,8(4):147-152.
10王茂忠.基于BIM技术的装配式建筑工程信息化管理平台[J].北方建筑,2024,9(1):112-116. 被引量：1

1王涛,吕鑫.基于可见光图像的目标探测与识别算法研究[J].科学技术创新,2022(7):17-20.
2杨金融.艺术设计领域专业英语本科教学现状研究[J].艺术科技,2021,34(24):223-225.
3王志海,吉叶,陈萍,周敏李.区块链技术对审计的影响研究综述[J].中国农业会计,2022(2):15-18.
4钟帅.运城市登山旅游俱乐部发展现状的调查与分析[J].可持续发展,2022,12(2):308-313.
5李万宁,庄典,徐质文,金星,周欣,石邢.基于BIM的建筑运行阶段性能监测数据与建筑本体模型的集成方法研究[J].建筑技艺,2022,28(1):102-105. 被引量：1
6范凌云.基于卷积神经网络和深度特征融合的学习表情识别[J].科学技术创新,2022(11):85-88.
7李烁,李靖.国内1,3-丙二醇市场现状和发展建议[J].精细与专用化学品,2022,30(3):12-15. 被引量：5
8韩斌.基于动态系统理论视角下我国外语教学研究的统计分析与展望[J].现代英语,2021(19):1-3.
9李心峰.主持人语[J].艺术学研究,2022(2):4-4.
10韩柠,吴铁成,刘辉,衣样,李雅楠,宋小春,杨伟光,董炀.近地小天体动能撞击器GNC系统设计与仿真研究[J].空间碎片研究,2021,21(4):55-61.

计算机工程

2022年第4期

浏览历史

内容加载中请稍等...

面向视频数据的深度学习目标识别算法综述被引量：11

参考文献11

二级参考文献22

共引文献384

同被引文献68

引证文献11

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

面向视频数据的深度学习目标识别算法综述 被引量：11

参考文献11

二级参考文献22

共引文献384

同被引文献68

引证文献11

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

面向视频数据的深度学习目标识别算法综述被引量：11