一种基于特征导向解耦网络结构的滤波器修剪方法

Feature-Oriented and Decoupled Network Structure Based Filter Pruning Method

下载PDF

导出

摘要现有的很多深度神经网络模型剪枝方法需要修改损失函数或在网络中嵌入额外的变量,无法直接受益于预训练网络,而且复杂化了前向推理和训练过程.到目前为止,大部分特征导向的剪枝工作仅利用通道内信息分析滤波器的重要性,使得剪枝过程无法利用通道间的潜在联系.针对上述问题,基于特征导向从通道间的角度考虑滤波器修剪任务,使用几何距离度量通道间的潜在相关性,将滤波器修剪定义为一个优化问题,并引入贪婪策略寻求最优解的近似解.该方法实现了剪枝与网络、剪枝与训练的解耦,从而简化了修剪任务.大量的实验证明了该方法对于各种网络结构都有良好的性能,例如在CIFAR-10数据集上,将VGG-16的参数量和浮点运算量分别降低了87.1%和63.7%,并且达到93.81%的高精度.还使用轻量型网络MobileFaceNets和CASIA-WebFace数据集评估该方法的性能,结果显示使用该剪枝方法后,MobileFaceNets在参数量和浮点运算量分别降低58.0%和63.6%的情况下,在LFW上的测试精度仍然达到99.02%,而且推理精度几乎没有损失(源代码发布在:https://github.com/SSriven/FOAD). Many existing pruning methods for deep neural network models require modifying the loss function or embedding additional variables in the network,thus they can’t benefit from the pre-trained network directly,and complicate the forward inference and training process.So far,most of the feature-oriented pruning work only use the intra-channel information to analyze the importance of filters,which makes it impossible to use the potential connections among channels during the pruning process.To address these issues,we consider the feature-oriented filter pruning task from an inter-channel perspective.The proposed method uses geometric distance to measure the potential correlation among channels,defines filter pruning as an optimization problem,and applies a greedy strategy to find an approximate solution to the optimal solution.The method achieves the decoupling of pruning from network and pruning from training,thus simplifying the pruning task.Extensive experiments demonstrate that the proposed pruning method achieves high performance for various network structures,for example,on CIFAR-10 dataset,the number of parameters and floating point operations of VGG-16 are reduced by 87.1%and 63.7%,respectively,while still has an accuracy of 93.81%.We also evaluate the proposed method using MobileFaceNets,a lightweight network,on CASIA-WebFace large dataset,and the evaluation results show that,when the number of parameters and floatingpoint operations are reduced by 58.0%and 63.6%,respectively,MobileFaceNets achieves an accuracy of 99.02%on LFW dataset without loss of inference accuracy(The code is available at:https://github.com/SSriven/FOAD).

作者施瑞文李光辉代成龙张飞飞 Shi Ruiwen;Li Guanghui;Dai Chenglong;Zhang Feifei(School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi,Jiangsu 214122;Jiangsu Bangrong Microelectronics Co.,Ltd.,Kunshan,Jiangsu 215300)

机构地区江南大学人工智能与计算机学院江苏邦融微电子有限公司

出处《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1836-1849,共14页 Journal of Computer Research and Development

基金国家自然科学基金项目(62072216) 苏州市科技计划项目(SGC2021070)。

关键词深度学习模型压缩模型剪枝神经网络加速几何距离 deep learning model compression model pruning neural network acceleration geometric distance

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1张晶,王子铭,任永功.A3C深度强化学习模型压缩及知识抽取[J].计算机研究与发展,2023,60(6):1373-1384. 被引量：2
2龚成,卢冶,代素蓉,刘方鑫,陈新伟,李涛.一种超低损失的深度神经网络量化压缩方法[J].软件学报,2021,32(8):2391-2407. 被引量：5

二级参考文献5

1葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：50
2刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：473
3雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
4彭亚丽,张鲁,张钰,刘侍刚,郭敏.基于深度反卷积神经网络的图像超分辨率算法[J].软件学报,2018,29(4):926-934. 被引量：23
5朱斐,吴文,伏玉琛,刘全.基于双深度网络的安全深度强化学习方法[J].计算机学报,2019,42(8):1812-1826. 被引量：26

共引文献5

1刘鸿志,王耀力,常青.面向嵌入式系统的轻量级目标检测算法[J].电子设计工程,2022,30(24):104-109. 被引量：1
2王子为,鲁继文,周杰.基于自适应梯度优化的二值神经网络[J].电子学报,2023,51(2):257-266.
3杨宁,朱其星,伍攀峰,王允森,安剑,孙福磊.星上遥感影像在轨处理进展研究[J].空间电子技术,2023,20(4):1-8. 被引量：1
4管雨涵,刘勘.突发公共卫生事件中的应急政策知识图谱[J].软件导刊,2023,22(9):113-123. 被引量：1
5宋玉红,沙行勉,诸葛晴凤,许瑞,王寒.RR-SC:边缘设备中基于随机计算神经网络的运行时可重配置框架[J].计算机研究与发展,2024,61(4):840-855.

1石超逸,李脉,周黎明.配子-胚胎源性疾病研究进展[J].现代实用医学,2023,35(9):1127-1130.
2张昊立,张菁,倪建辉,陈龙,高典.引入注意力机制的LSTM-FCN海上风电功率预测[J].太阳能学报,2024,45(6):444-450. 被引量：2
3杨树林.“益粒种子”漂流书架传书香[J].社会与公益,2024(4):54-55.
4刘书婷,牟怿,陈为真.基于改进YOLOv5的碎米检测数据集[J].中国粮油学报,2024,39(4):140-148.
5张凤营,李自强.永磁电机转子系统非线性共振分析[J].造纸装备及材料,2024,53(3):14-16. 被引量：1
6卢幸蓉.甘肃省苹果矮化密植栽培中的整形修剪技术要点[J].南方农业,2024,18(10):13-15.
7李鑫怡,高英,赵春杰.定向距离函数的光滑化方法及其应用[J].运筹学学报（中英文）,2024,28(2):117-130.
8吴晓,肖珍.用二阶共轭方程近似解研究楔形杆振动及屈曲[J].湖南师范大学自然科学学报,2024,47(3):137-142.
9殷鹏程,谭曼丽莎,曹阳梅,单德山.基于迁移学习图像识别的桥梁监测数据异常检测方法[J].大连交通大学学报,2024,45(3):106-113.
10黑亚芳,胡建成.常微分方程的数值求解与方法[J].成都信息工程大学学报,2024,39(4):499-511.

计算机研究与发展

2024年第7期

浏览历史

内容加载中请稍等...

一种基于特征导向解耦网络结构的滤波器修剪方法

参考文献2

二级参考文献5

共引文献5

相关作者

相关机构

相关主题

浏览历史