神经网络压缩联合优化方法的研究综述被引量：1

An overview of the joint optimization method for neural network compression

下载PDF

导出

摘要随着人工智能应用的实时性、隐私性和安全性需求增大,在边缘计算平台上部署高性能的神经网络成为研究热点。由于常见的边缘计算平台在存储、算力、功耗上均存在限制,因此深度神经网络的端侧部署仍然是一个巨大的挑战。目前,克服上述挑战的一个思路是对现有的神经网络压缩以适配设备部署条件。现阶段常用的模型压缩算法有剪枝、量化、知识蒸馏,多种方法优势互补同时联合压缩可实现更好的压缩加速效果,正成为研究的热点。本文首先对常用的模型压缩算法进行简要概述,然后总结了“知识蒸馏+剪枝”、“知识蒸馏+量化”和“剪枝+量化”3种常见的联合压缩算法,重点分析论述了联合压缩的基本思想和方法,最后提出了神经网络压缩联合优化方法未来的重点发展方向。 With the increasing demand for real-time,privacy and security of AI applications,deploying high-performance neural network on an edge computing platform has become a research hotspot.Since common edge computing platforms have limitations in storage,computing power,and power consumption,the edge deployment of deep neural networks is still a huge challenge.Currently,one method to overcome the challenges is to compress the existing neural network to adapt to the device deployment conditions.The commonly used model compression algorithms include pruning,quantization,and knowledge distillation.By taking advantage of complementary multiple methods,the combined compression can achieve better compression acceleration effect,which is becoming a hot spot in research.This paper first makes a brief overview of the commonly used model compression algorithms,and then summarizes three commonly used joint compression algorithms:“knowledge distillation+pruning”,“knowledge distillation+quantification”and"pruning+quantification",focusing on the analysis and discussion of basic ideas and methods of joint compression.Finally,the future key development direction of the neural network compression joint optimization method is put forward.

作者宁欣赵文尧宗易昕张玉贵陈灏周琦马骏骁 NING Xin;ZHAO Wenyao;ZONG Yixin;ZHANG Yugui;CHEN Hao;ZHOU Qi;MA Junxiao(Institute of Semiconductors,Chinese Academy of Sciences,Beijing 100083,China;School of Microelectronics,Hefei University of Technology,Hefei 230009,China;Bureau of Frontier Sciences and Education,Chinese Academy of Sciences,Beijing 100864,China;College of Artificial Intelligence,Nankai University,Tianjin 300071,China)

机构地区中国科学院半导体研究所合肥工业大学微电子学院中国科学院前沿科学与教育局南开大学人工智能学院

出处《智能系统学报》 CSCD 北大核心 2024年第1期36-57,共22页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(62373343) 北京市自然科学基金项目(L233036)。

关键词神经网络压缩剪枝量化知识蒸馏模型压缩深度学习 neural network compression pruning quantization knowledge distillation model compression deep learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1邵仁荣,刘宇昂,张伟,王骏.深度学习中知识蒸馏研究综述[J].计算机学报,2022,45(8):1638-1673. 被引量：29
2高晗,田育龙,许封元,仲盛.深度学习模型压缩与加速综述[J].软件学报,2021,32(1):68-92. 被引量：61
3黄震华,杨顺志,林威,倪娟,孙圣力,陈运文,汤庸.知识蒸馏研究综述[J].计算机学报,2022,45(3):624-653. 被引量：37

二级参考文献7

1黄震华,张佳雯,田春岐,孙圣力,向阳.基于排序学习的推荐算法研究综述[J].软件学报,2016,27(3):691-713. 被引量：108
2雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
3Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU.Recent advances in efficient computation of deep convolutional neural networks[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):64-77. 被引量：36
4纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃.深度神经网络压缩与加速综述[J].计算机研究与发展,2018,55(9):1871-1888. 被引量：55
5成科扬,王宁,师文喜,詹永照.深度学习可解释性研究进展[J].计算机研究与发展,2020,57(6):1208-1217. 被引量：68
6化盈盈,张岱墀,葛仕明.深度学习模型可解释性的研究进展[J].信息安全学报,2020,5(3):1-12. 被引量：42
7曹文龙,芮建武,李敏.神经网络模型压缩方法综述[J].计算机应用研究,2019,36(3):649-656. 被引量：12

共引文献118

1邢丽萍,靳红梅,李洪安,李占利.利用多尺度分析推进牙齿图像识别的研究综述[J].微纳电子与智能制造,2022,4(4):34-49.
2牛鑫,吕现伟,余辰.边缘智能:现状与挑战[J].武汉大学学报（理学版）,2023,69(2):270-282. 被引量：5
3刘艳红.生成式人工智能的三大安全风险及法律规制——以ChatGPT为例[J].东方法学,2023(4):29-43. 被引量：146
4李汶霞,殷声.燃烧合成中的有机物[J].材料导报,2000,14(5):45-48. 被引量：14
5侯晓龙,周培林,邹月娴.基于知识蒸馏的口语理解模型研究与实现[J].电子技术与软件工程,2021(2):180-184.
6刘鑫,韩强,周永帅,庹先国.基于深度学习的白酒分类识别方法[J].食品与机械,2021,37(4):68-71. 被引量：3
7李良熹,荣进国.基于深度学习的智能烘培类商品识别系统研究[J].信息与电脑,2021,33(13):156-158. 被引量：1
8孟宪法,刘方,李广,黄萌萌.卷积神经网络压缩中的知识蒸馏技术综述[J].计算机科学与探索,2021,15(10):1812-1829. 被引量：13
9蒋润熙,阿里甫·库尔班,耿丽婷.面向轻量化网络的安全帽检测算法[J].计算机工程与应用,2021,57(20):263-270. 被引量：19
10彭宇,姬森展,于希明,刘胜剑.语义分割网络的FPGA加速计算方法综述[J].仪器仪表学报,2021,42(9):1-12. 被引量：17

同被引文献9

1徐嘉荟.基于模型剪枝的神经网络压缩技术研究[J].信息通信,2019,0(12):165-167. 被引量：7
2李继宇,张铁民,彭孝东,闫国琦,陈瑜.小型无人机在农田信息监测系统中的应用[J].农机化研究,2010,32(5):183-186. 被引量：35
3陈仲新,任建强,唐华俊,史云,冷佩,刘佳,王利民,吴文斌,姚艳敏,哈斯图亚.农业遥感研究应用进展与展望[J].遥感学报,2016,20(5):748-767. 被引量：246
4孙刚,黄文江,陈鹏飞,高帅,王秀.轻小型无人机多光谱遥感技术应用进展[J].农业机械学报,2018,49(3):1-17. 被引量：91
5鲍文霞,张鑫,胡根生,黄林生,梁栋,林泽.基于深度卷积神经网络的田间麦穗密度估计及计数[J].农业工程学报,2020,36(21):186-193. 被引量：22
6谢元澄,何超,于增源,沈毅,姜海燕,梁敬东.复杂大田场景中麦穗检测级联网络优化方法[J].农业机械学报,2020,51(12):212-219. 被引量：12
7高晗,田育龙,许封元,仲盛.深度学习模型压缩与加速综述[J].软件学报,2021,32(1):68-92. 被引量：61
8许德刚,王露,李凡.深度学习的典型目标检测算法研究综述[J].计算机工程与应用,2021,57(8):10-25. 被引量：190
9孙俊,杨锴锋,罗元秋,沈继锋,武小红,钱磊.基于无人机图像的多尺度感知麦穗计数方法[J].农业工程学报,2021,37(23):136-144. 被引量：11

引证文献1

1刘旭,宋作杰,耿霞.面向无人机边缘计算的小麦麦穗计数轻量化模型研究[J].山东农业大学学报（自然科学版）,2024,55(3):453-465.

1贺琦,李猛,李明皓.一种基于震动信号的近海岸安防预警技术研究[J].网络安全与数据治理,2023,42(S02):60-68.
2吴北苹,何晶,王彦璎,王晓薇.改进灰色层次分析法的机动导航保障能力评估[J].弹箭与制导学报,2024,44(1):75-83.

智能系统学报

2024年第1期

浏览历史

内容加载中请稍等...

神经网络压缩联合优化方法的研究综述被引量：1

参考文献3

二级参考文献7

共引文献118

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

神经网络压缩联合优化方法的研究综述 被引量：1

参考文献3

二级参考文献7

共引文献118

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

神经网络压缩联合优化方法的研究综述被引量：1