基于低秩分解和向量量化的深度网络压缩方法

Deep network compression method based on low-rank decomposition and vector quantization

下载PDF

导出

摘要随着人工智能的发展,深度神经网络成为多种模式识别任务中必不可少的工具,由于深度卷积神经网络(CNN)参数量巨大、计算复杂度高,将它部署到计算资源和存储空间受限的边缘计算设备上成为一项挑战。因此,深度网络压缩成为近年来的研究热点。低秩分解与向量量化是深度网络压缩中重要的两个研究分支,其核心思想都是通过找到原网络结构的一种紧凑型表达,从而降低网络参数的冗余程度。通过建立联合压缩框架,提出一种基于低秩分解和向量量化的深度网络压缩方法——可量化的张量分解(QTD)。该方法能够在网络低秩结构的基础上实现进一步的量化,从而得到更大的压缩比。在CIFAR-10数据集上对经典ResNet和该方法进行验证的实验结果表明,QTD能够在准确率仅损失1.71个百分点的情况下,将网络参数量压缩至原来的1%。而在大型数据集ImageNet上把所提方法与基于量化的方法PQF(Permute,Quantize,and Fine-tune)、基于低秩分解的方法TDNR(Tucker Decomposition with Nonlinear Response)和基于剪枝的方法CLIP-Q(Compression Learning by In-parallel Pruning-Quantization)进行比较与分析的实验结果表明,QTD能够在相同压缩范围下实现更好的分类准确率。 As the development of artificial intelligence,deep neural network has become an essential tool in various pattern recognition tasks.Deploying deep Convolutional Neural Networks(CNN)on edge computing equipment is challenging due to storage space and computing resource constraints.Therefore,deep network compression has become an important research topic in recent years.Low-rank decomposition and vector quantization are the most popular network compression techniques,which both try to find a compact representation of the original network,thereby reducing the redundancy of network parameters.By establishing a joint compression framework,a deep network compression method based on low-rank decomposition and vector decomposition—Quantized Tensor Decomposition(QTD)was proposed to obtain higher compression ratio by performing further quantization based on the low-rank structure of network.Experimental results of classical ResNet and the proposed method on CIFAR-10 dataset show that the volume can be compressed to 1%by QTD with a slight accuracy drop of 1.71 percentage points.Moreover,the proposed method was compared with the quantization-based method PQF(Permute,Quantize,and Fine-tune),the low-rank decomposition-based method TDNR(Tucker Decomposition with Nonlinear Response),and the pruning-based method CLIP-Q(Compression Learning by In-parallel Pruning-Quantization)on large dataset ImageNet.Experimental results show that QTD can maintain better classification accuracy with same compression range.

作者王东炜刘柏辰韩志王艳美唐延东 WANG Dongwei;LIU Baichen;HAN Zhi;WANG Yanmei;TANG Yandong(State Key Laboratory of Robotics(Shenyang Institute of Automation,Chinese Academy of Sciences),Shenyang Liaoning 110016,China;Institutes for Robotics and Intelligent Manufacturing,Chinese Academy of Sciences,Shenyang Liaoning 110016,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区机器人学国家重点实验室(中国科学院沈阳自动化研究所) 中国科学院机器人与智能制造研究院中国科学院大学

出处《计算机应用》 CSCD 北大核心 2024年第7期1987-1994,共8页 journal of Computer Applications

基金国家重点研发计划项目(2020YFB1313400)。

关键词卷积神经网络张量分解向量量化模型压缩图像分类 Convolutional Neural Network(CNN) tensor decomposition vector quantization model compression image classification

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
2王忠锋,徐志远,宋纯贺,张宏宇,蔡颖凯.基于梯度的深度网络剪枝算法[J].计算机应用,2020,40(5):1253-1259. 被引量：3
3巩凯强,张春梅,曾光华.卷积神经网络模型剪枝结合张量分解压缩方法[J].计算机应用,2020,40(11):3146-3151. 被引量：7

二级参考文献5

1张敏,戈文航.基于概率计算的重叠双聚类算法[J].计算机工程与设计,2012,33(9):3579-3583. 被引量：3
2何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
3靳丽蕾,杨文柱,王思乐,崔振超,陈向阳,陈丽萍.一种用于卷积神经网络压缩的混合剪枝方法[J].小型微型计算机系统,2018,39(12):2596-2601. 被引量：21
4吴进,吴汉宁,刘安,李聪,李乔深.一种基于Lasso回归与SVD融合的深度学习模型压缩方法[J].电讯技术,2019,59(5):495-500. 被引量：9
5Zhi-HuaZhou.Rule Extraction： Using Neural Networks or for Neural Networks？[J].Journal of Computer Science & Technology,2004,19(2):249-253. 被引量：14

共引文献50

1董晓,刘雷,李晶,冯晓兵.面向稀疏卷积神经网络的GPU性能优化方法[J].软件学报,2020(9):2944-2964. 被引量：3
2周光朕,杜姗姗,冯瑞,欧丽君,刘斌.基于残差量化卷积神经网络的人脸识别方法[J].计算机系统应用,2018,27(8):35-41. 被引量：5
3杨扬,蓝章礼,陈巍.基于统计分析的卷积神经网络模型压缩方法[J].计算机系统应用,2018,27(8):49-55. 被引量：1
4段秉环,文鹏程,李鹏.面向嵌入式应用的深度神经网络压缩方法研究[J].航空计算技术,2018,48(5):50-53. 被引量：3
5冀树伟,杨喜旺,黄晋英,尹宁.基于特征复用的卷积神经网络模型压缩方法[J].计算机应用,2019,39(6):1607-1613. 被引量：6
6张裕,杨海涛.基于深度学习的轻量化遥感图像目标检测方法[J].信息技术,2019,43(9):163-167. 被引量：5
7薛宪堂,王登阳,张翼,周威,王燕国.基于卷积神经网络的接触网支柱号识别方法研究[J].铁路计算机应用,2019,28(9):11-15.
8刘崇阳,刘勤让.基于LZW编码的卷积神经网络压缩方法[J].计算机工程,2019,45(9):188-193.
9肖理想,罗泽.基于Android和卷积神经网络的鸟类识别系统[J].计算机系统应用,2019,28(9):58-64. 被引量：4
10杨博文,杨海涛,高浩浩.CNN加速器中卷积计算单元的硬件设计[J].数字技术与应用,2019,37(10):136-137. 被引量：2

1康虹,方明山,李东东,董珍,姚晓乐,贾冬梅,赵晓峰.起重机臂架用BT770无缝钢管的开发[J].包钢科技,2023,49(4):54-57.
2渠超洋,韩建军.一种基于模特征的增量式张量Tucker分解方法[J].控制与决策,2024,39(7):2431-2437.
3林冲,闫文君,纪纲,于斌,王莹.深度神经网络参数轻量化方法综述[J].中国电子科学研究院学报,2024,19(4):350-363.
4SangSeok Lee,HaeWon Moon,Lee Sael.Block Incremental Dense Tucker Decomposition with Application to Spatial and Temporal Analysis of Air Quality Data[J].Computer Modeling in Engineering & Sciences,2024,139(4):319-336.
5梁成,马东阳.基于OPC技术的轧管设备工业网络的通讯改造[J].中文科技期刊数据库（全文版）工程技术,2016(12):282-282.
6宋玉慧,曹逸飞,黄思晨,李凯超,杜如海,严蕾,付正坤,张正龙.Plasmon-induced nonlinear response on gold nanoclusters[J].Chinese Physics B,2024,33(4):36-39.
7Zhu Hongfei,Cao Zhiwei,Zhao Yuping,Li Dou.Quantized Decoders that Maximize Mutual Information for Polar Codes[J].China Communications,2024,21(7):125-134.
8刘微容,张志强,张宁,孟家豪,张敏,刘婕.基于TT-Tucker分解的无预训练LC卷积神经网络压缩方法[J].华南理工大学学报（自然科学版）,2024,52(7):29-38.
9Andrea Tognazzi,Paolo Franceschini,Olga Sergaeva,Luca Carletti,Ivano Alessandri,Giovanni Finco,Osamu Takayama,Radu Malureanu,Andrei V.Lavrinenko,Alfonso C.Cino,Domenico de Ceglia,Costantino De Angelis.Giant photoinduced reflectivity modulation of nonlocal resonances in silicon metasurfaces[J].Advanced Photonics,2023,5(6):83-91. 被引量：1
10CHEN Yan,LU Zhonghao,LIU Yunxia.Fast measurement and prediction method for electromagnetic susceptibility of receiver[J].Journal of Systems Engineering and Electronics,2024,35(2):275-285.

计算机应用

2024年第7期

浏览历史

内容加载中请稍等...

基于低秩分解和向量量化的深度网络压缩方法

参考文献3

二级参考文献5

共引文献50

相关作者

相关机构

相关主题

浏览历史