深度卷积神经网络在计算机视觉中的应用研究综述被引量：531

Applications of Deep Convolutional Neural Network in Computer Vision

下载PDF

导出

摘要随着大数据时代的到来,含更多隐含层的深度卷积神经网络(Convolutional neural networks,CNNs)具有更复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和特征表达能力。使用深度学习算法训练的卷积神经网络模型自提出以来在计算机视觉领域的多个大规模识别任务上取得了令人瞩目的成绩。本文首先简要介绍深度学习和卷积神经网络的兴起与发展,概述卷积神经网络的基本模型结构、卷积特征提取和池化操作。然后综述了基于深度学习的卷积神经网络模型在图像分类、物体检测、姿态估计、图像分割和人脸识别等多个计算机视觉应用领域中的研究现状和发展趋势,主要从典型的网络结构的构建、训练方法和性能表现3个方面进行介绍。最后对目前研究中存在的一些问题进行简要的总结和讨论,并展望未来发展的新方向。 Deep learning has recently achieved breakthrough progress in speech recognition and image recognition. With the advent of big data era, deep convolutional neural networks with more hidden layers and more complex architectures have more powerful ability of feature learning and feature representation. Convolutional neural network models trained by deep learning algorithm have attained remarkable performance in many large scale recognition tasks of computer vision since they are presented. In this paper, the arising and development of deep learning and convolutional neural network are briefly introduced, with emphasis on the basic structure of convolutional neural network as well as feature extraction using convolution and pooling operations. The current research status and trend of convolutional neural net- works based on deep learning and their applications in computer vision are reviewed, such as image classi- fication, object detection, pose estimation, image segmentation and face detection etc. Some related works are introduced from the following three aspects, i. e. , construction of typical network structures, training methods and performance. Finally, some existing problems in the present research are briefly summarized and discussed and some possible new directions for future development are prospected.

作者卢宏涛张秦川

机构地区上海交通大学计算机科学与工程系

出处《数据采集与处理》 CSCD 北大核心 2016年第1期1-17,共17页 Journal of Data Acquisition and Processing

基金国家自然科学基金(61272247)资助项目

关键词深度学习卷积神经网络图像识别目标检测计算机视觉 deep learning convolutional neural network image recognition object detection computer vision

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献59

1Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60 (2) 91 110.
2Dalai N, Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition (CVPR), IEEE Computer Society Conference on. San Diego, USA: IEEE, 2005, 1 886-893.
3Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786) : 504-507.
4麦麦提艾力.吐尔逊,戴礼荣.深度神经网络在维吾尔语大词汇量连续语音识别中的应用[J].数据采集与处理,2015,30(2):365-371. 被引量：12
5Hubel D H, Wiesel T N. Receptive fields, binocular interaction and functional architecture in the catrs visual cortex[J]. The Journal of Physiology, 1962, 160(1): 106-154.
6Fukushima K, Miyake S. Neocognitron: A new algorithm for pattern recognition tolerant of deformations and shifts in posi- tion[J]. Pattern Recognition, 1982, 15(6): 455-469.
7Ruck D W, Rogers S K, Kabrisky M. Feature selection using a multilayer perceptron[J]. Journal of Neural Network Com- puting, 1990, 2(2): 40-48.
8Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[J]. Nature, 1986,3231 533 538.
9LeCun Y, Denker J S, Henderson D, et al. Handwritten digit recognition with a back-propagation network[C]//Advances in Neural Information Processing Systems. Colorado, USA Is. n. ], 1990: 396-404.
10LeCun Y, Cortes C. MNIST handwritten digit database[EB/OL], http//yann, lecun, com/exdb/mnist, 2010.

二级参考文献93

1马剑英,张晓娜.基于免疫遗传算法的图像多阈值分割[J].微计算机信息,2007(3):309-311. 被引量：12
2陈俊,李红.利用模拟退火遗传算法实现图像阈值分割[J].应用数学,2005,18(S1):107-110. 被引量：3
3马保国,乔玲玲,贾寅波.基于局部自适应阈值的细胞图像分割方法[J].计算机应用研究,2009,26(2):755-756. 被引量：9
4陈涛,司锡才.基于直方图的模糊最大指数熵图像分割方法[J].哈尔滨工程大学学报,2004,25(4):521-524. 被引量：2
5杜奇,向健勇,袁胜春.基于边缘强度的红外图像阈值分割方法研究[J].红外与激光工程,2004,33(3):288-291. 被引量：18
6刘平,陈斌,阮波.基于边缘信息的图像阈值化分割方法[J].计算机应用,2004,24(9):28-30. 被引量：33
7周铭.低信噪比红外小目标图像的分割方法[J].激光与红外,2004,34(3):225-228. 被引量：12
8张鹏,卢广山,王合龙,田青.基于三步搜索法的特征相关目标跟踪算法[J].电光与控制,2004,11(4):38-40. 被引量：10
9吴一全,朱兆达.图像处理中阈值选取方法30年(1962—1992)的进展(一)[J].数据采集与处理,1993,8(3):193-201. 被引量：145
10吴一全,朱兆达.图像处理中阈值选取方法30年(1962—1992)的进展(二)[J].数据采集与处理,1993,8(4):268-282. 被引量：96

共引文献152

1邵志明,王怀彬,董志城,原育慧,李军会,赵龙莲.基于近红外相机成像和阈值分割的苹果早期损伤检测[J].农业机械学报,2021,52(S01):134-139. 被引量：13
2袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
3高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
4马天兵,刘健,杜菲,陈南南.基于改进Otsu方法的振动图像分割研究[J].电光与控制,2019,26(2):11-15. 被引量：18
5王广志,童明,丁辉.基于几何特征的X射线图像中圆形标志点自动提取[J].数据采集与处理,2015,30(5):965-972. 被引量：1
6吴彤,刘嘉新.基于车辆侧向特征的视频监控车型分类的研究[J].仪表技术,2016(2):29-32.
7张松,汪烈军,祁彦庆.一种基于PCNN和改进的OTSU的图像分割算法[J].中国科技论文,2016,11(2):236-240. 被引量：7
8张婧茹,莫锦秋,曹家勇,梁庆华.一种鲁棒的室外金属标记物图像分割算法[J].机械设计与研究,2016,32(3):31-37. 被引量：6
9张新明,张贝,涂强.广义概率Tsallis熵的快速多阈值图像分割[J].数据采集与处理,2016,31(3):502-511. 被引量：7
10王宏文,宁乐,雷盼雲,郭章亮.基于分水岭模型的光照不均匀图像分割[J].中南民族大学学报（自然科学版）,2016,35(3):85-91. 被引量：1

同被引文献3692

1先智勇.传统艺术“物性”的当代释放——从敦煌壁画媒材到现代岩彩语言的嬗变[J].中外文化与文论,2020(3):176-185. 被引量：1
2叶明,李晓丞,刘凯,韩伟,姚佳烽.一种基于U2-Net模型的电阻抗成像方法[J].仪器仪表学报,2021,42(2):235-243. 被引量：17
3王森,伍星,张印辉,柳小勤.基于全卷积神经网络和结构化森林的结构体裂纹分割方法[J].仪器仪表学报,2020(8):170-179. 被引量：7
4李秀智,李家豪,张祥银,彭小彬.基于深度学习的机器人最优抓取姿态检测方法[J].仪器仪表学报,2020(5):108-117. 被引量：30
5马双双,王佳,曹少中,杨树林,赵伟,张寒.基于深度学习的二维人体姿态估计算法综述[J].计算机系统应用,2022,31(10):36-43. 被引量：8
6曹富奎,白天,许晓珑.基于公路监控视频的车辆检测和分类[J].计算机系统应用,2020,29(10):267-273. 被引量：5
7马蕾.基于心律特征提取和卷积神经网络的运动健康分析算法[J].系统仿真技术,2021,17(4):265-269. 被引量：1
8刘春梅,左红卫.敦煌壁画元素在文创中的运用研究与反思[J].新疆艺术（汉文）,2020(5):17-21. 被引量：7
9王俊秀.数字社会中的隐私重塑——以“人脸识别”为例[J].探索与争鸣,2020,0(2):86-90. 被引量：46
10匡文波.智能算法推荐技术的逻辑理路、伦理问题及规制方略[J].深圳大学学报（人文社会科学版）,2021,38(1):144-151. 被引量：53

引证文献531

1周晓,焦晨,朱开瑄.基于卷积神经网络的废旧塑料瓶颜色分拣系统[J].数字制造科学,2021(3):227-232. 被引量：3
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3吴丽娟,任海清,关贵明,梁岱立,黄尧.基于人脸姿态识别的课堂学习状态反馈系统的设计与实现[J].沈阳师范大学学报（自然科学版）,2022,40(2):127-132. 被引量：2
4杨全.关于高校计算机视觉课程教学的思考[J].计算机产品与流通,2020,9(9):172-172.
5傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：51
6范慧鹏,闪恒杰,房哲续,郭江川.用于故障诊断的深度学习分类模型及方法[J].河南电力,2023(S01):51-55. 被引量：1
7杨耿,张业明,侯金利,刘咏炫,鲁骏,周靖.高速公路图像识别技术应用探析[J].中国交通信息化,2022(S01):294-298. 被引量：1
8胡远洋.基于深度神经网络的电阻层析成像重建方法[J].电子测量技术,2023,46(5):78-82.
9唐露,王从庆.基于Tree-CNN的飞机腐蚀铆钉分类[J].吉林大学学报（信息科学版）,2020,38(1):55-63. 被引量：1
10张逸,程筱胜,崔海华(指导),石诚,张小迪,张逢骏.基于卷积神经网络的复材射线图像孔缺陷识别[J].光学与光电技术,2020,18(3):75-80. 被引量：6

二级引证文献2667

1施玉娟,林璐颖,杨文元.基于拉普拉斯超分辨率印刷电路板瑕疵检测方法[J].中国体视学与图像分析,2020,25(3):295-303. 被引量：1
2刘艳红.自动驾驶的风险类型与法律规制[J].国家检察官学院学报,2024,32(1):114-130. 被引量：1
3张德锋,蒋明炎,倪尔波.成像技术在烧结球团中的应用[J].自动化与仪器仪表,2019(S01):95-97.
4尹诗,侯国莲,胡晓东,周继威,弓林娟.风力发电机组发电机前轴承故障预警及辨识[J].仪器仪表学报,2020(5):242-251. 被引量：27
5林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：21
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：12
7李志强,陈黎卿.农业植保机器人研究现状及展望[J].玉林师范学院学报,2020,41(3):1-14. 被引量：4
8陈晓武,刘国华,雷尚平.机器视觉平台在钢铁制造业的实现与应用[J].冶金自动化,2020,44(S01):197-201. 被引量：3
9忻超,卓琳,徐波雷,王伟楠.基于目标检测的医院感染规范监测方法研究[J].中国数字医学,2022,17(9):54-59. 被引量：5
10邴芳飞,金永涛,张文豪,徐娜,余涛,张丽丽,裴莹莹.基于机器学习的遥感影像云检测研究进展[J].遥感技术与应用,2023,38(1):129-142. 被引量：1

1郭东亮,刘小明,郑秋生.基于卷积神经网络的互联网短文本分类方法[J].计算机与现代化,2017(4):78-81. 被引量：13
2李葆青.基于卷积神经网络的模式分类器[J].大连大学学报,2003,24(2):19-23. 被引量：7
3刘小明,张英,郑秋生.基于卷积神经网络模型的互联网短文本情感分类[J].计算机与现代化,2017(4):73-77. 被引量：9
4张蕾,翁贻方,赵耿.一种基于CNNs电路模型的伪随机信号产生方法[J].北京电子科技学院学报,2010,18(4):25-29. 被引量：2
5张蕾.CNNs非线性电路的稳定性分析[J].北京电子科技学院学报,2011,19(4):56-59.
6张蕾.基于CNNs电路模型的运动目标检测方法[J].微型机与应用,2011,30(11):52-55.
7程国建,刘丽婷.深度学习算法应用于岩石图像处理的可行性研究[J].软件导刊,2016,15(9):163-166. 被引量：16
8曹钰.基于区域信息的深度卷积神经网络研究综述[J].电子世界,2017,0(6):32-32. 被引量：4
9张蕾.CNNs非线性电路模型在数据安全传输中的应用[J].科技信息,2011(14):193-195.
10江梅,何汉林.线性矩阵不等式及其在细胞神经网络保性能控制中的应用[J].大学数学,2014,30(4):24-28.

数据采集与处理

2016年第1期

浏览历史

内容加载中请稍等...

深度卷积神经网络在计算机视觉中的应用研究综述被引量：531

参考文献59

二级参考文献93

共引文献152

同被引文献3692

引证文献531

二级引证文献2667

相关作者

相关机构

相关主题

浏览历史

深度卷积神经网络在计算机视觉中的应用研究综述 被引量：531

参考文献59

二级参考文献93

共引文献152

同被引文献3692

引证文献531

二级引证文献2667

相关作者

相关机构

相关主题

浏览历史

深度卷积神经网络在计算机视觉中的应用研究综述被引量：531