深度神经网络模型压缩综述被引量：16

Survey of Deep Neural Networks Model Compression

下载PDF

导出

摘要近年来,随着深度学习的飞速发展,深度神经网络受到了越来越多的关注,在许多应用领域取得了显著效果。通常,在较高的计算量下,深度神经网络的学习能力随着网络层深度的增加而不断提高,因此深度神经网络在大型数据集上的表现非常卓越。然而,由于其计算量大、存储成本高、模型复杂等特性,使得深度学习无法有效地应用于轻量级移动便携设备。因此,压缩、优化深度学习模型成为目前研究的热点。当前主要的模型压缩方法有模型裁剪、轻量级网络设计、知识蒸馏、量化、体系结构搜索等。对以上方法的性能、优缺点和最新研究成果进行了分析总结,并对未来研究方向进行了展望。 In recent years,the deep neural networks have gained more and more attention with the rapid development of deep learning.It has achieved remarkable effect in many application fields.Usually,at a higher computation,the learning ability of deep neural networks is improved with the increase of depth,which makes the performance of deep learning on large datasets especially successful.However,the deep learning can􀆳t be effectively applied to the lightweight mobile portable device due to the characteristics of large amount of calculation,high storage cost and complicated model.Therefore,compressing and simplifying the deep learning model has become the research hot spot.Currently,the main model compression methods include pruning,lightweight network design,knowledge distillation,quantization,neural architecture search,etc.This paper analyses and summarizes the performance,advantages and limitations and the latest research results of the model compression methods,and prospects the future research direction.

作者耿丽丽牛保宁 GENG Lili;NIU Baoning(College of Information and Computer,Taiyuan University of Technology,Taiyuan 030024,China;Experimental Center,Shanxi University of Finance and Economics,Taiyuan 030006,China)

机构地区太原理工大学信息与计算机学院山西财经大学实验中心

出处《计算机科学与探索》 CSCD 北大核心 2020年第9期1441-1455,共15页 Journal of Frontiers of Computer Science and Technology

基金国家重点研发计划(No.2017YFB1401000) 山西省重点研发计划(No.201903D421007)。

关键词深度学习模型压缩神经网络 deep learning model compression neural networks

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1黄聪,常滔,谭虎,吕绍和,王晓东.基于权值相似性的神经网络剪枝[J].计算机科学与探索,2018,12(8):1278-1285. 被引量：8
2靳丽蕾,杨文柱,王思乐,崔振超,陈向阳,陈丽萍.一种用于卷积神经网络压缩的混合剪枝方法[J].小型微型计算机系统,2018,39(12):2596-2601. 被引量：21
3徐喆,宋泽奇.带比例因子的卷积神经网络压缩方法[J].计算机工程与应用,2018,54(12):105-109. 被引量：4
4曹文龙,芮建武,李敏.神经网络模型压缩方法综述[J].计算机应用研究,2019,36(3):649-656. 被引量：12

二级参考文献4

1费芸洁,邓伟.一种基于灵敏度分析的神经网络剪枝方法[J].计算机工程与应用,2007,43(7):34-35. 被引量：3
2金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.深度学习在手写汉字识别中的应用综述[J].自动化学报,2016,42(8):1125-1141. 被引量：109
3张德园,常云翔,张利国,石祥滨.SAT-CNN:基于卷积神经网络的遥感图像分类算法[J].小型微型计算机系统,2018,39(4):859-864. 被引量：18
4韩云飞,蒋同海,马玉鹏,徐春香,张睿.深度神经网络的压缩研究[J].计算机应用研究,2018,35(10):2894-2897. 被引量：12

共引文献38

1马力,王永雄.基于稀疏化双线性卷积神经网络的细粒度图像分类[J].模式识别与人工智能,2019,32(4):336-344. 被引量：14
2程陶然,李阳.面向航空应用的神经网络轻量化设计[J].电脑知识与技术,2019,15(4Z):191-192.
3卢海伟,夏海峰,袁晓彤.基于滤波器注意力机制与特征缩放系数的动态网络剪枝[J].小型微型计算机系统,2019,40(9):1832-1838. 被引量：8
4沈悦.铁路异物入侵深度识别网络快速训练算法[J].电子设计工程,2019,27(22):48-54. 被引量：1
5谢斌红,钟日新,潘理虎,张英俊.结合剪枝与流合并的卷积神经网络加速压缩方法[J].计算机应用,2020,40(3):621-625. 被引量：7
6王忠锋,徐志远,宋纯贺,张宏宇,蔡颖凯.基于梯度的深度网络剪枝算法[J].计算机应用,2020,40(5):1253-1259. 被引量：3
7陈程军,毛莺池,王绎超.基于激活-熵的分层迭代剪枝策略的CNN模型压缩[J].计算机应用,2020,40(5):1260-1265. 被引量：2
8邵伟平,王兴,曹昭睿,白帆.基于MobileNet与YOLOv3的轻量化卷积神经网络设计[J].计算机应用,2020,40(S01):8-13. 被引量：46
9乔延婷,陈万培,张涛.基于SSD的轻量级车辆检测网络[J].无线电工程,2020,50(11):926-931. 被引量：9
10甘岚,李佳,沈鸿飞.面向嵌入式的残差网络加速方法研究[J].小型微型计算机系统,2020,41(11):2314-2320. 被引量：2

同被引文献96

1葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：50
2赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：5
3陆晔,祝涵珂,黄海涛.深度学习模型压缩方法及产品研究[J].电信科学,2020,36(S01):185-192. 被引量：2
4马鹏,樊艳芳.基于深度迁移学习的小样本智能变电站电力设备部件检测[J].电网技术,2020,44(3):1148-1159. 被引量：86
5罗枭.基于深度学习的自然语言处理研究综述[J].智能计算机与应用,2020(4):133-137. 被引量：13
6李睿凡,梁昊雨,冯方向,张光卫,王小捷.全卷积神经结构的段落式图像描述算法[J].北京邮电大学学报,2019,42(6):155-161. 被引量：2
7韩永华,汪亚明,康锋,赵匀.基于小波多分辨率分解的农田障碍物检测[J].农业机械学报,2013,44(6):215-221. 被引量：11
8柴洋,王向东.基于图像处理的温室大棚中番茄的病害识别[J].自动化技术与应用,2013,32(9):83-89. 被引量：20
9胡侯立,魏维,胡蒙娜.深度学习算法的原理及应用[J].信息技术,2015,39(2):175-177. 被引量：22
10李冬梅,高志荣,熊承义,周城,侯建华.低秩分解的人脸图像光照均衡化预处理[J].光电工程,2015,42(9):28-34. 被引量：3

引证文献16

1许昊,张凯,田英杰,种法广,王子超.深度神经网络图像描述综述[J].计算机工程与应用,2021,57(9):9-22. 被引量：11
2郭昕刚,屈诺希,杨洛.基于深度学习的实时人脸检测[J].长春工业大学学报,2021,42(2):181-185. 被引量：3
3胡嵽,冯子亮.基于深度学习的轻量级道路图像语义分割算法[J].计算机应用,2021,41(5):1326-1331. 被引量：7
4丁文锐,刘春蕾,李越,张宝昌.二值卷积神经网络综述[J].航空学报,2021,42(6):181-195. 被引量：5
5孟宪法,刘方,李广,黄萌萌.卷积神经网络压缩中的知识蒸馏技术综述[J].计算机科学与探索,2021,15(10):1812-1829. 被引量：13
6江洋洋,金伯,张宝昌.深度学习在自然语言处理领域的研究进展[J].计算机工程与应用,2021,57(22):1-14. 被引量：22
7薛金林,李雨晴,曹梓建.基于深度学习的模糊农田图像中障碍物检测技术[J].农业机械学报,2022,53(3):234-242. 被引量：10
8刘宇,雷雪梅.融合MobileNetV3特征的结构化剪枝方法[J].上海交通大学学报,2023,57(9):1203-1213. 被引量：3
9邱晓蕾,张红梅,严海兵.基于量化的CNN恶意代码检测方法[J].计算机仿真,2023,40(7):224-228. 被引量：2
10王明英,王嘉,裴志远,李宇豪,李荣荣.基于深度学习的番茄叶部病害识别方法研究[J].农业灾害研究,2023,13(8):25-27. 被引量：1

二级引证文献79

1曾伟辉,张文凤,陈鹏,胡根生,梁栋.基于SCResNeSt的低分辨率水稻害虫图像识别方法[J].农业机械学报,2022,53(9):277-285. 被引量：7
2陈玲玲,施政,廖凯涛,宋月君,张红梅.基于卷积神经网络的高分遥感影像耕地提取研究[J].农业机械学报,2022,53(9):168-177. 被引量：9
3刘雨,党青聪,宋增才.基于人脸检测的汽车防儿童误锁系统[J].科技通报,2022,38(12):34-38.
4周宇辉,何志琴.基于改进注意力机制的图像描述算法[J].智能计算机与应用,2022,12(2):58-63.
5龙学军,高枫.基于机器视觉的高速道路落石检测[J].中国交通信息化,2021(7):131-133. 被引量：1
6谢军,肖朝轩,张思刚,刘力卿,律方成,谢庆.基于迁移学习和特征融合的复合绝缘子憎水性等级判别方法[J].电网技术,2021,45(10):3964-3971. 被引量：8
7吴天宇.基于特征复用网络的医学图像分割[J].现代计算机,2021,27(28):90-94.
8李金讯,郭娜,林树鸿,颜清.基于多重图像隐藏防伪标识公文防篡改的新方法研究[J].电力大数据,2021,24(9):1-8. 被引量：2
9千月欣,王永忠,李佳骏,徐天羿.基于深度学习的机场能见度预测研究[J].云南民族大学学报（自然科学版）,2021,30(6):615-620. 被引量：4
10周长才,刘爽,王昕.基于卷积神经网络的颅内出血检测[J].长春工业大学学报,2021,42(5):469-473. 被引量：3

1厉鹏,周福才,张帅.基于BSSEVD的可搜索加密方案原型系统设计与实现[J].东北大学学报（自然科学版）,2020,41(9):1244-1250. 被引量：4

计算机科学与探索

2020年第9期

浏览历史

内容加载中请稍等...

深度神经网络模型压缩综述被引量：16

参考文献4

二级参考文献4

共引文献38

同被引文献96

引证文献16

二级引证文献79

相关作者

相关机构

相关主题

浏览历史

深度神经网络模型压缩综述 被引量：16

参考文献4

二级参考文献4

共引文献38

同被引文献96

引证文献16

二级引证文献79

相关作者

相关机构

相关主题

浏览历史

深度神经网络模型压缩综述被引量：16