深度神经网络压缩与加速综述被引量：54

Deep Neural Network Compression and Acceleration:A Review

下载PDF

导出

摘要深度神经网络在人工智能的应用中,包括计算机视觉、语音识别、自然语言处理方面,取得了巨大成功.但这些深度神经网络需要巨大的计算开销和内存存储,阻碍了在资源有限环境下的使用,如移动或嵌入式设备端.为解决此问题,在近年来产生大量关于深度神经网络压缩与加速的研究工作.对现有代表性的深度神经网络压缩与加速方法进行回顾与总结,这些方法包括了参数剪枝、参数共享、低秩分解、紧性滤波设计及知识蒸馏.具体地,将概述一些经典深度神经网络模型,详细描述深度神经网络压缩与加速方法,并强调这些方法的特性及优缺点.此外,总结了深度神经网络压缩与加速的评测方法及广泛使用的数据集,同时讨论分析一些代表性方法的性能表现.最后,根据不同任务的需要,讨论了如何选择不同的压缩与加速方法,并对压缩与加速方法未来发展趋势进行展望. In recent years, deep neural networks （D N Ns） have achieved remarkable success in manyartificial intelligence （AI ） applications, including computer vision, speech recognition and natural language processing. However, such DNNs have been accompanied by significant increase incomputational costs and storage services, which prohibits the usages of DNNs on resource-limited environments such as mobile or embedded devices. To this end, the studies of DNN compression and acceleration have recently become more emerging. In this paper, we provide a review on the existingrepresentative DNN compression and acceleration methods, including parameter pruning , parameter sharing, low-rank decomposition, compact filter designed, and knowledge distillation . Specifically, this paper provides an overview of DNNs , describes the details of dif ferent DNN compression and acceleration methods, and highlights the propert ies, advantages and drawbacks. Furthermore , we summarize the evaluation criteria and datasets widely used in DNN compression and acceleration, andalso discuss the performance of the representative methods. In the end, we discuss how to choosedifferent compression and acceleration methods to meet the needs of dif ferent tasks, and envisionfuture directions on this topic.

作者纪荣嵘林绍辉晁飞吴永坚黄飞跃 Ji Rongrong;Lin Shaohui;Chao Fei;Wu Yongjian;Huang Feiyue(School of Information Science and Engineering,Xiamen University,Xiamen,Fujian,361005;Fujian Key Laboratory of Sensing and Computing for Smart City（Xiamen University）,Xiamen.Fujian,361005;Bestlmage Laboratory,Tencent Technology（Shanghai）Co.,Lid,Shanghai,200233)

机构地区厦门大学信息科学与技术学院福建省智慧城市感知与计算重点实验室(厦门大学) 上海腾讯科技有限公司优图实验室

出处《计算机研究与发展》 EI CSCD 北大核心 2018年第9期1871-1888,共18页 Journal of Computer Research and Development

基金国家重点研发计划项目(2017YFC0113000 2016YFB10015032) 国家自然科学基金项目(U1705262 61772443 61402388 61572410) 国家自然科学基金优秀青年科学基金项目(61422210) 福建省自然科学基金项目(2017J01125)~~

关键词深度神经网络压缩深度神经网络加速参数剪枝参数共享低秩分解知识蒸馏 DNN compression DNN acceleration parameter pruning parameter sharing low-rank decomposition knowledge distillation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1周晔,张军平.基于多尺度深度学习的商品图像检索[J].计算机研究与发展,2017,54(8):1824-1832. 被引量：12
2梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：131

二级参考文献2

1蒋树强,闵巍庆,王树徽.面向智能交互的图像识别技术综述与展望[J].计算机研究与发展,2016,53(1):113-122. 被引量：91
2王仲远,程健鹏,王海勋,文继荣.短文本理解研究[J].计算机研究与发展,2016,53(2):262-269. 被引量：48

共引文献141

1姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：12
2张克,张文俊,朱蕴文,邢毅雪.基于内联关系的方面级情感分析方法[J].上海大学学报（自然科学版）,2022,28(1):157-169.
3王光,李鸿宇,邱云飞,郁博文,柳厅文.基于图卷积记忆网络的方面级情感分类[J].中文信息学报,2021,35(8):98-106. 被引量：15
4杜慧,俞晓明,刘悦,余智华,程学旗.融合词性和注意力的卷积神经网络对象级情感分类方法[J].模式识别与人工智能,2018,31(12):1120-1126. 被引量：10
5冯秋燕.基于混合马尔科夫链模型和扩散的图像检索[J].计算机应用与软件,2018,35(5):258-263. 被引量：1
6朱斐,吴文,刘全,伏玉琛.一种最大置信上界经验采样的深度Q网络方法[J].计算机研究与发展,2018,55(8):1694-1705. 被引量：13
7陈勤,伍传敏.基于主成分分析的彩色图转灰度图方法的研究[J].佳木斯大学学报（自然科学版）,2018,36(3):380-383. 被引量：1
8宗玉英,段晓芳.面向手机动画的基于注意力机制和卷积神经网络的短信情感分析[J].计算机系统应用,2018,27(8):226-231.
9张皓,吴建鑫.基于深度特征的无监督图像检索研究综述[J].计算机研究与发展,2018,55(9):1829-1842. 被引量：17
10陈扬,曾诚,程成,邹恩岑,顾建伟,陆悠,奚雪峰.一种基于CNN的足迹图像检索与匹配方法[J].南京师范大学学报（工程技术版）,2018,18(3):39-45. 被引量：7

同被引文献261

1董晓,刘雷,李晶,冯晓兵.面向稀疏卷积神经网络的GPU性能优化方法[J].软件学报,2020(9):2944-2964. 被引量：3
2葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：45
3任源,潘俊,刘京京,何燕冬,何进.人工智能芯片的研究进展[J].微纳电子与智能制造,2019,1(2):20-34. 被引量：9
4尹首一.人工智能芯片概述[J].微纳电子与智能制造,2019,1(2):7-11. 被引量：15
5徐嘉荟.基于模型剪枝的神经网络压缩技术研究[J].信息通信,2019,0(12):165-167. 被引量：6
6张媛,秦勇,程晓卿,庞学苗,邢宗义.基于改进NARX神经网络的接触线表面不平顺与弓网接触力关联分析方法[J].中国铁道科学,2012,33(3):84-91. 被引量：7
7施乐平,杨征宇,马宪民,汤元会.ARM嵌入式系统综述[J].中国测试,2012,38(S1):14-16. 被引量：15
8陈载清,石俊生,白凤翔.基于模糊粗糙集的图像自动分类研究[J].吉林大学学报（工学版）,2013,43(S1):209-212. 被引量：3
9杨小牛.基于“软件星”的综合一体化空间信息系统[J].电子科学技术评论,2004(4):15-22. 被引量：16
10刘晓芳,刘会金,陈允平.人工智能技术在电能质量分析中的应用[J].电工技术杂志,2004,26(12):66-70. 被引量：9

引证文献54

1Peng Liu,Wei Jiang,Xiaohui Wang,Hongmin Li,Hongjian Sun.Research and application of artificial intelligence service platform for the power field[J].Global Energy Interconnection,2020,3(2):175-185. 被引量：2
2曾凡婧,雷鸣.基于卷积神经网络的花卉识别研究[J].电脑知识与技术,2019,15(4Z):185-188. 被引量：1
3向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿.基于细粒度数据流架构的稀疏神经网络全连接层加速[J].计算机研究与发展,2019,56(6):1192-1204. 被引量：10
4陈莉君,李卓.基于深度神经压缩的YOLO优化[J].计算机技术与发展,2019,29(12):72-75. 被引量：2
5宋非洋,吴黎明,郑耿哲,何欣颖.基于MobileNetV3的结构性剪枝优化[J].自动化与信息工程,2019,40(6):20-25. 被引量：7
6任杰,高岭,于佳龙,袁璐.面向边缘设备的高能效深度学习任务调度策略[J].计算机学报,2020,43(3):440-452. 被引量：15
7孙胜,李叙晶,刘敏,杨博,过晓冰.面向异构IoT设备协作的DNN推断加速研究[J].计算机研究与发展,2020,57(4):709-722.
8晏晓天,黄山.基于分组异构卷积的轻量级目标检测网络[J].计算机科学,2020,47(4):108-111. 被引量：5
9裴斐,刘进锋,李崤河.一种面向移动端的图像风格迁移模型压缩算法[J].激光与光电子学进展,2020,57(6):219-225. 被引量：2
10薛峰,方维维.EdgeMI:资源受限条件下深度学习多设备协同推理[J].现代计算机,2020,26(20):27-32.

二级引证文献204

1沙文馨.一款新型智能垃圾桶的设计研究[J].计算机产品与流通,2020,9(7):83-83. 被引量：4
2牛鑫,吕现伟,余辰.边缘智能:现状与挑战[J].武汉大学学报（理学版）,2023,69(2):270-282. 被引量：1
3刘孝军,王飞.基于AI的煤矿视频智能分析技术[J].煤炭科学技术,2022,50(S02):260-264. 被引量：5
4梁占泽,马平,赵俊达,王铮,刘涛.煤矿井下智能无轨辅助运输技术研究[J].煤炭工程,2022,54(S01):6-11. 被引量：4
5王宇斐,刘骁佳,刘欢,曹立俊,罗志强.孪生神经网络在航天产品电性能测试方面的应用[J].航空学报,2022,43(S01):201-209.
6万瑜,林劭辰.基于边缘计算的管道振动感知系统设计与研究[J].电子测量技术,2023,46(18):6-15.
7王铮,刘纪平,车向红,王勇,杜凯旋.基于卷积神经网络的地图相似度匹配方法研究[J].测绘科学,2022,47(7):169-175. 被引量：3
8李汶霞,殷声.燃烧合成中的有机物[J].材料导报,2000,14(5):45-48. 被引量：14
9平嘉蓉,张正华,沈逸,陈豪,刘源,杨意,尤倩,苏权.基于轻量级神经网络的人群计数模型设计[J].无线电工程,2020,50(6):442-446. 被引量：2
10贾小飞.基于代码设计工具地素描教育研究[J].粘接,2020,42(5):173-176.

1张铮.大数据下个人信息安全保护的关键技术教学[J].学园,2017,0(25):143-143. 被引量：1
2许恩东,刘啸,吴俊,石晓菡.央行法定数字货币的探索[J].时代金融,2018(20):14-15. 被引量：3
3谭志文.高三物理总复习重要性及有效方法[J].东西南北（教育）,2018(18):168-168.
4曹伟.数字经济之美国数字贸易规则初探[J].中国信息安全,2018(7):14-15.
5薛喜君.树影[J].朔方,2018,0(8):73-84.
6季云岗,沈瀛生.中联肝健康促进中心推出“药物创新协作计划”[J].中国社会组织,2018,0(14):58-58.
7陈孝友,康洁.精准扶贫视角下高职院校资助育人的实现路径[J].湖州职业技术学院学报,2018,16(2):61-64. 被引量：4
8阎焯.应对系统不稳定性应考虑的因素——用于管理内存存储的服务器配置参数详解[J].金融科技时代,2018,26(7):74-76.
9谢其龙.在交流中打开孩子的心结[J].生活教育,2018,0(8):15-17.
10布沙热木·喀哈尔.维汉反义词研究状况[J].双语学习,2017,0(11):38-40.

计算机研究与发展

2018年第9期

浏览历史

内容加载中请稍等...

深度神经网络压缩与加速综述被引量：54

参考文献2

二级参考文献2

共引文献141

同被引文献261

引证文献54

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

深度神经网络压缩与加速综述 被引量：54

参考文献2

二级参考文献2

共引文献141

同被引文献261

引证文献54

二级引证文献204

相关作者

相关机构

相关主题

浏览历史

深度神经网络压缩与加速综述被引量：54