深度网络模型压缩综述被引量：42

Survey of Deep Neural Network Model Compression

下载PDF

导出

摘要深度网络近年来在计算机视觉任务上不断刷新传统模型的性能,已逐渐成为研究热点.深度模型尽管性能强大,然而由于参数数量庞大、存储和计算代价高,依然难以部署在受限的硬件平台上(如移动设备).模型的参数在一定程度上能够表达其复杂性,相关研究表明,并不是所有的参数都在模型中发挥作用,部分参数作用有限、表达冗余,甚至会降低模型的性能.首先,对国内外学者在深度模型压缩上取得的成果进行了分类整理,依此归纳了基于网络剪枝、网络精馏和网络分解的方法;随后,总结了相关方法在多种公开深度模型上的压缩效果;最后,对未来的研究可能的方向和挑战进行了展望. Deep neural networks have continually surpassed traditional methods on a variety of computer vision tasks. Though deep neural networks are very powerful, the large number of weights consumes considerable storage and calculation time, making it hard to deploy on resource-constrained hardware platforms such as mobile system. The number of weights in deep neural networks represents the complexity to an extent, but not all the weights contribute to the performance according to recent researches. Specifically, some weights are redundant and even decrease the performance. This survey offers a systematic summarization of existing research achievements of the domestic and foreign researchers in recent years in the aspects of network pruning, network distillation, and network decomposition. Furthermore, comparisons of compression performance are provided on several public deep neural networks. Finally, a perspective of future work and challenges in this research area are discussed.

作者雷杰高鑫宋杰王兴路宋明黎

机构地区浙江大学计算机科学与技术学院

出处《软件学报》 EI CSCD 北大核心 2018年第2期251-266,共16页 Journal of Software

基金国家自然科学基金(61572428 U1509206)~~

关键词深度神经网络网络压缩网络剪枝网络精馏网络分解 deep neural network network compression network pruning network distillation network decomposition

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
2张敏,戈文航.基于概率计算的重叠双聚类算法[J].计算机工程与设计,2012,33(9):3579-3583. 被引量：3
3Zhi-HuaZhou.Rule Extraction： Using Neural Networks or for Neural Networks？[J].Journal of Computer Science & Technology,2004,19(2):249-253. 被引量：14

二级参考文献45

1闫雷鸣,孙志挥.一种基于二次互信息的双聚类算法[J].计算机工程与应用,2006,42(22):158-160. 被引量：4
2Quinlan J R. Comparing connectionist and symbolic learning methods. In Computational Learning Theory and Natural Learning Systems, Rivest R L (Ed.), Vol.1,Cambridge, MA, MIT Press, 1994, pp.445-456.
3Chalup S, Hayward R, Diederich J. Rule extraction from artificial neural networks trained on elementary number classification tasks. In Proc. the 9th Australian Conference on Neural Networks, Brisbane, Australia, 1998,pp.265-270.
4Maire F. Rule-extraction by backpropagation of polyhedra. Neural Networks, 1999, 12(4-5): 717-725.
5Bologna G. Rule extraction from a multi layer perceptron with staircase activation functions. In Proc. the IEEE-INNS-ENNS International Joint Conference on Neural Networks, Como, Italy, 2000, 3: 419-424.
6Vahed A, Omlin C W. Rule extraction from recurrent neural networks using a symbolic machine learning algorithm. In Proc. the 6th International Conference on Neural Information Processing, Dunedin, New Zealand,1999, pp.712-717.
7Golea M. On the complexity of rule extraction from neural networks and network querying. In Proc. theAISB'96 Workshop on Rule Eztraction from TrainedNeural Networks, Brighton, UK, 1996, pp.51-59.
8Roy A. On connectionism, rule extraction, and brainlike learning. IEEE Trans. Fuzzy Systems, 2000, 8(2):222-227.
9Duch W, Adamczak R, Grabczewski K. A new methodology of extraction, optimization and application of crisp and fuzzy logical rules. IEEE Trans. Neural Networks, 2001, 12(2): 277-306.
10Zhou Z H, Jiang Y, Chen S F, Extracting symbolic rules from trained neural network ensembles. AI Communications, 2003, 16(1): 3-15.

共引文献35

1彭晓晖,徐宏喆,李盼,王社昌,任玉成.Research on confirmation of basic technological parameters of tension levellers based on neural network and genetic algorithm[J].Journal of Pharmaceutical Analysis,2008,20(3):160-163.
2胡即明,楼旭阳,金凯鹏.基于线性二次型调节器的神经网络PID控制系统[J].应用科技,2005,32(11):51-53.
3何清,史忠植.基于覆盖的分类算法研究进展[J].计算机学报,2007,30(8):1235-1243. 被引量：3
4何清,史忠植.基于超曲面的分类算法研究进展[J].智能系统学报,2007,2(6):1-7.
5张向华.带模糊语义的神经网络规则提取[J].重庆大学学报（自然科学版）,2008,31(3):328-331.
6於时才,马宁,亢军贤.基于免疫克隆选择算法的神经网络规则抽取[J].计算机工程,2009,35(1):173-175. 被引量：4
7孙昊,张琦,许勇.机器学习在GDP预测分析中的应用研究[J].计算机技术与发展,2009,19(2):227-229. 被引量：2
8陈慧敏,张渭源,顾洪波.Application of Rough Sets to Evaluate Fabric Smoothness Grade[J].Journal of Donghua University(English Edition),2009,26(4):356-360.
9肖新攀,余嘉元,姜远,周志华.从心理学数据中发现可理解的模式[J].计算机科学与探索,2011,5(3):247-255. 被引量：1
10郑炜,杨威,宋海静,周南,郭凯源.一种基于规则提取的自动化测试用例生成方法[J].西北工业大学学报,2012,30(2):296-300. 被引量：2

同被引文献155

1葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：45
2曹文靖.小样本水下目标识别的孪生网络的设计[J].机械设计,2020,37(S02):203-207. 被引量：1
3徐嘉荟.基于模型剪枝的神经网络压缩技术研究[J].信息通信,2019,0(12):165-167. 被引量：6
4王登阳,杨超.高速综合检测时空同步技术[J].铁路技术创新,2012(1):16-19. 被引量：13
5孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：592
6廖志芳,李玲,刘丽敏,李永周.三部图张量分解标签推荐算法[J].计算机学报,2012,35(12):2625-2632. 被引量：17
7熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：172
8张建华,孔繁涛,吴建寨,翟治芬,韩书庆,曹姗姗.基于改进VGG卷积神经网络的棉花病害识别模型[J].中国农业大学学报,2018,23(11):161-171. 被引量：98
9邹本友,李翠平,谭力文,陈红,王绍卿.基于用户信任和张量分解的社会网络推荐[J].软件学报,2014,25(12):2852-2864. 被引量：37
10庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：450

引证文献42

1董晓,刘雷,李晶,冯晓兵.面向稀疏卷积神经网络的GPU性能优化方法[J].软件学报,2020(9):2944-2964. 被引量：3
2周光朕,杜姗姗,冯瑞,欧丽君,刘斌.基于残差量化卷积神经网络的人脸识别方法[J].计算机系统应用,2018,27(8):35-41. 被引量：5
3杨扬,蓝章礼,陈巍.基于统计分析的卷积神经网络模型压缩方法[J].计算机系统应用,2018,27(8):49-55. 被引量：1
4段秉环,文鹏程,李鹏.面向嵌入式应用的深度神经网络压缩方法研究[J].航空计算技术,2018,48(5):50-53. 被引量：3
5冀树伟,杨喜旺,黄晋英,尹宁.基于特征复用的卷积神经网络模型压缩方法[J].计算机应用,2019,39(6):1607-1613. 被引量：6
6张裕,杨海涛.基于深度学习的轻量化遥感图像目标检测方法[J].信息技术,2019,43(9):163-167. 被引量：5
7薛宪堂,王登阳,张翼,周威,王燕国.基于卷积神经网络的接触网支柱号识别方法研究[J].铁路计算机应用,2019,28(9):11-15.
8刘崇阳,刘勤让.基于LZW编码的卷积神经网络压缩方法[J].计算机工程,2019,45(9):188-193.
9肖理想,罗泽.基于Android和卷积神经网络的鸟类识别系统[J].计算机系统应用,2019,28(9):58-64. 被引量：2
10杨博文,杨海涛,高浩浩.CNN加速器中卷积计算单元的硬件设计[J].数字技术与应用,2019,37(10):136-137. 被引量：2

二级引证文献329

1阳雨妍,宋爱国,沈书馨,李会军.基于CNN-GRU的遥操作机器人操作者识别与自适应速度控制方法[J].仪器仪表学报,2021,42(3):123-131. 被引量：16
2何龙健,钟子乐,邹大辉,黄灿斌,邓卓然,梁艳.面向医疗整容的三维人脸重建与编辑系统[J].计算机系统应用,2022,31(12):69-77.
3李小艳,宋亚林,乐飞.残差密集块的卷积神经网络图像去噪[J].计算机系统应用,2022,31(10):166-174. 被引量：2
4牛鑫,吕现伟,余辰.边缘智能:现状与挑战[J].武汉大学学报（理学版）,2023,69(2):270-282. 被引量：1
5彭红星,何慧君,高宗梅,田兴国,邓倩婷,咸春龙.基于改进ShuffleNetV2模型的荔枝病虫害识别方法[J].农业机械学报,2022,53(12):290-300. 被引量：15
6明玉琴,夏添,彭艳兵.基于GAN模型优化的神经机器翻译[J].中文信息学报,2020(4):47-54. 被引量：6
7张余冉,段喜萍,李昀松,刘庭圆.基于ResNet-ACmix融合特征的ECO目标跟踪算法改进[J].哈尔滨师范大学自然科学学报,2023,39(1):75-82.
8李汶霞,殷声.燃烧合成中的有机物[J].材料导报,2000,14(5):45-48. 被引量：14
9欧阳勇,李玉晶.牙本质磷蛋白及其功能研究[J].北京口腔医学,2000,8(1):43-46. 被引量：2
10郭荆学.安琪TH-AADY在肖家桥酒厂的应用[J].酿酒科技,2000(3):49-49.

1AI在视频安防领域大有可为[J].网络安全和信息化,2017,0(11):10-10.
2詹恩.略谈新课标下情境创设在高中物理教学中的应用[J].新课程（中学）,2017,0(10):41-41.
3邹月娴,余嘉胜,陈泽晗,陈锦,王毅.图像分类卷积神经网络的特征选择模型压缩方法（英文）[J].控制理论与应用,2017,34(6):746-752. 被引量：8
4戴天福,林翌,许建中,胡浩,许晨.超临界流体精馏技术装备及其在活性天然产物分离中的应用[J].化学工程与装备,2017(12):269-273.
5胡诚,陈亮,张勋,孙韶媛.基于卷积神经网络的监控场景下行人属性识别[J].现代计算机,2018,24(1):22-26. 被引量：3
6陈俊文.空分设备及设施燃爆危险预防方法和措施[J].决策与信息,2016,0(23):318-318.
7吴艇港,潘鹤林,束铭杰,戴万里,胡四平.基于Aspen Plus的紫罗兰酮异构体精馏分离模拟[J].现代化工,2018,38(2):202-205. 被引量：1
8王磊,赵英海,杨国顺,王若琪.面向嵌入式应用的深度神经网络模型压缩技术综述[J].北京交通大学学报,2017,41(6):34-41. 被引量：4
9李长征,张瑜.基于广义回归神经网络的传感器故障检测[J].推进技术,2017,38(9):2130-2137. 被引量：13
10葛仕明,赵胜伟,刘文瑜,李晨钰.基于深度特征蒸馏的人脸识别[J].北京交通大学学报,2017,41(6):27-33. 被引量：1

软件学报

2018年第2期

浏览历史

内容加载中请稍等...

深度网络模型压缩综述被引量：42

参考文献3

二级参考文献45

共引文献35

同被引文献155

引证文献42

二级引证文献329

相关作者

相关机构

相关主题

浏览历史

深度网络模型压缩综述 被引量：42

参考文献3

二级参考文献45

共引文献35

同被引文献155

引证文献42

二级引证文献329

相关作者

相关机构

相关主题

浏览历史

深度网络模型压缩综述被引量：42