基于融合多级注意力迁移的神经网络压缩方法

NEURAL NETWORK COMPRESSION METHOD BASED ON MERGING MULTI-LEVEL ATTENTION TRANSFER

下载PDF

导出

摘要针对目前深度卷积神经网络规模大、计算复杂度高、对存储空间需求大等问题,提出一种基于融合多级注意力迁移的神经网络的压缩方法。该方法基于教师-学生网络结构,设计了新的注意力图融合的方式以及注意力在教师网络与学生网络之间的迁移策略,使学生网络能够学习教师网络中的注意力信息,以此来提升学生网络的准确率。所提出的方法在CIFAR数据集上进行实验,实验结果表明,在学生网络规模和教师网络规模相差一半以上的情况下,准确率仅下降了1.5%~2.5%。 Aimed at the problems of the large scale of deep convolutional neural networks, the high computational complexity and the large demand for storage space, a compression method based on merging multi-level attention transfer neural network is proposed. Based on the teacher-student network structure, this method designed a new attention map merging method and attention transfer strategy between teacher network and student network, so that the student network could learn the attention information in the teacher network, so as to improve the accuracy of the student network. The proposed method was tested on the CIFAR data set. The experimental results show that the accuracy rate has only dropped by 1.5%-2.5%, when the student network scale and the teacher network scale differ by more than half.

作者李俊杰彭书华郭俊伦 Li Junjie;Peng Shuhua;Guo Junlun(School of Automation,Beijing Information Science and Technology University,Beijing 100101,China)

机构地区北京信息科技大学自动化学院

出处《计算机应用与软件》北大核心 2023年第1期184-188,共5页 Computer Applications and Software

基金国家自然科学基金项目(61801032)。

关键词卷积神经网络知识迁移模型压缩注意力机制教师网络学生网络 Convolutional neural network Knowledge transfer Model compression Attention mechanism Teacher network Student network

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献2

1高钦泉,赵岩,李根,童同.基于知识蒸馏的超分辨率卷积神经网络压缩方法[J].计算机应用,2019,39(10):2802-2808. 被引量：7
2纪荣嵘,林绍辉,晁飞,吴永坚,黄飞跃.深度神经网络压缩与加速综述[J].计算机研究与发展,2018,55(9):1871-1888. 被引量：56

二级参考文献2

1梁斌,刘全,徐进,周倩,章鹏.基于多注意力卷积神经网络的特定目标情感分析[J].计算机研究与发展,2017,54(8):1724-1735. 被引量：138
2周晔,张军平.基于多尺度深度学习的商品图像检索[J].计算机研究与发展,2017,54(8):1824-1832. 被引量：12

共引文献61

1Peng Liu,Wei Jiang,Xiaohui Wang,Hongmin Li,Hongjian Sun.Research and application of artificial intelligence service platform for the power field[J].Global Energy Interconnection,2020,3(2):175-185. 被引量：3
2曾凡婧,雷鸣.基于卷积神经网络的花卉识别研究[J].电脑知识与技术,2019,15(4Z):185-188. 被引量：1
3向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿.基于细粒度数据流架构的稀疏神经网络全连接层加速[J].计算机研究与发展,2019,56(6):1192-1204. 被引量：11
4陈莉君,李卓.基于深度神经压缩的YOLO优化[J].计算机技术与发展,2019,29(12):72-75. 被引量：2
5宋非洋,吴黎明,郑耿哲,何欣颖.基于MobileNetV3的结构性剪枝优化[J].自动化与信息工程,2019,40(6):20-25. 被引量：9
6任杰,高岭,于佳龙,袁璐.面向边缘设备的高能效深度学习任务调度策略[J].计算机学报,2020,43(3):440-452. 被引量：16
7孙胜,李叙晶,刘敏,杨博,过晓冰.面向异构IoT设备协作的DNN推断加速研究[J].计算机研究与发展,2020,57(4):709-722. 被引量：1
8晏晓天,黄山.基于分组异构卷积的轻量级目标检测网络[J].计算机科学,2020,47(4):108-111. 被引量：5
9裴斐,刘进锋,李崤河.一种面向移动端的图像风格迁移模型压缩算法[J].激光与光电子学进展,2020,57(6):219-225. 被引量：3
10朱相荣,王磊,杨雅婷,董瑞,张俊.基于非自回归方法的维汉神经机器翻译[J].计算机应用,2020,40(7):1891-1895. 被引量：1

1宁欣,刘江宽,李卫军,石园,支金林,南方哲.利用通道剪枝技术的实时实例分割方法[J].太赫兹科学与电子信息学报,2023,21(1):95-101. 被引量：1
2叶榕,邵剑飞,张小为,邵建龙.基于BERT-CNN的新闻文本分类的知识蒸馏方法研究[J].电子技术应用,2023,49(1):8-13. 被引量：8
3岳阳职业技术学院教师在2022年全国高等学校外语微课优秀作品征集与交流活动中荣获佳绩[J].岳阳职业技术学院学报,2022,37(6).
4刘会东,余振华,杜方,宋丽娟.分块压缩学习剪枝算法[J].小型微型计算机系统,2023,44(2):269-274.
5蔡瑞初,伍运金,陈薇,郝志峰.面向多元时间序列的群体因果关系发现算法[J].计算机工程,2023,49(2):127-135.
6赵浩,郭鑫,吴忠云,杨玲,徐金荣,郑俊荣.基于仪器搭建的紫外-可见光谱探究型教学实验设计[J].实验技术与管理,2023,40(1):154-159. 被引量：6
7李晓红,王苗,杨晓丹.校外小“红领巾小记者团”这样建[J].辅导员,2022(24):48-50.

计算机应用与软件

2023年第1期

浏览历史

内容加载中请稍等...

基于融合多级注意力迁移的神经网络压缩方法

参考文献2

二级参考文献2

共引文献61

相关作者

相关机构

相关主题

浏览历史