改进聚类的深度神经网络压缩实现方法被引量：3

Deep neural networks compression based on improved clustering

下载PDF

导出

摘要深度神经网络通常是过参数化的,并且深度学习模型存在严重冗余,这导致了计算和存储的巨大浪费.针对这个问题,本文提出了一种基于改进聚类的方法来对深度神经网络进行压缩.首先通过剪枝策略对正常训练后的网络进行修剪,然后通过K-Means++聚类得到每层权重的聚类中心从而实现权值共享,最后进行各层权重的量化.本文在LeNet、AlexNet和VGG-16上分别进行了实验,提出的方法最终将深度神经网络整体压缩了30到40倍,并且没有精度损失.实验结果表明通过基于改进聚类的压缩方法,深度神经网络在不损失精度的条件下实现了有效压缩,这使得深度网络在移动端的部署成为了可能. Deep neural networks are typically over-parametrized and there is significant redundancy for deep learning models, which results in a waste of both computation and memory usage. In order to solve the problem, a new method based on improved clustering to compress the deep neural network is proposed. First of all, the network is pruned after the normal training. Then through the K-Means++ clustering the clustering center of each layer is gotten to achieve weight sharing. After the first two steps network weight quantization are also performed. The experiments on LeNet, AlexNet and VGG-16 are carried out, in which the deep neural network are compressed by 30 to 40 times without any loss of precision. The experimental results show that the deep neural network achieves effective compression without loss of accuracy through the method based on improved clustering, which makes the deployment of deep network on the mobile end possible.

作者刘涵王宇马琰 LIU Han;WANG Yu;MA Yan(School of Automation and Information Engineering, Xi’an University of Technology, Xi’an Shaanxi 710048, China)

机构地区西安理工大学自动化与信息工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2019年第7期1130-1136,共7页 Control Theory & Applications

基金国家自然科学基金重点项目(61833013) 陕西省重点研发计划重点项目(2018ZDXM-GY-089) 陕西省现代装备绿色制造协同创新中心研究计划(304-210891704) 陕西省教育厅科学研究计划(2017JS088) 西安理工大学特色研究计划(2016TS023)资助~~

关键词深度神经网络剪枝 K Means++聚类深度网络压缩 deep neural networks pruning K Means++ deep network compression

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：127
2刘知青,吴修竹.解读AlphaGo背后的人工智能技术[J].控制理论与应用,2016,33(12):1685-1687. 被引量：28

二级参考文献121

1MNIH V, KAVUKCUOGLU K, SILVER D, et al. Human-levelcontrol through deep reinforcement learning [J]. Nature, 2015,518(7540): 529 – 533.
2SILVER D, HUANG A, MADDISON C, et al. Mastering the gameof Go with deep neural networks and tree search [J]. Nature, 2016,529(7587): 484 – 489.
3AREL I. Deep reinforcement learning as foundation for artificialgeneral intelligence [M] //Theoretical Foundations of Artificial GeneralIntelligence. Amsterdam: Atlantis Press, 2012: 89 – 102.
4TEAAURO G. TD-Gammon, a self-teaching backgammon program,achieves master-level play [J]. Neural Computation, 1994,6(2): 215 – 219.
5SUTTON R S, BARTO A G. Reinforcement Learning: An Introduction[M]. Cambridge MA: MIT Press, 1998.
6KEARNS M, SINGH S. Near-optimal reinforcement learning inpolynomial time [J]. Machine Learning, 2002, 49(2/3): 209 – 232.
7KOCSIS L, SZEPESVARI C. Bandit based Monte-Carlo planning[C] //Proceedings of the European Conference on MachineLearning. Berlin: Springer, 2006: 282 – 293.
8LITTMAN M L. Reinforcement learning improves behaviour fromevaluative feedback [J]. Nature, 2015, 521(7553): 445 – 451.
9BELLMAN R. Dynamic programming and Lagrange multipliers[J]. Proceedings of the National Academy of Sciences, 1956,42(10): 767 – 769.
10WERBOS P J. Advanced forecasting methods for global crisis warningand models of intelligence [J]. General Systems Yearbook, 1977,22(12): 25 – 38.

共引文献151

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2舒忠.基于深度学习的图像样本标签赋值校正算法实现[J].数字印刷,2019(4):38-45. 被引量：2
3程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：111
4刘洋.人工智能环境下高校档案管理的策略研究[J].办公自动化,2019,24(2):22-24. 被引量：2
5张董,游福成,王惠华,姜超,李明.受限制Boltzmann机深度置信网络与手写数字识别[J].北京印刷学院学报,2016,24(4):56-58. 被引量：4
6侯宇青阳,全吉成,王宏伟.深度学习发展综述[J].舰船电子工程,2017,37(4):5-9. 被引量：37
7王奇,秦进.基于动作空间划分的MAXQ自动分层方法[J].计算机应用,2017,37(5):1357-1362.
8褚飞,李艳.人工智能AlphaGo技术及其应用探析[J].信息系统工程,2017,0(6):107-107. 被引量：4
9石征锦,王康.深度强化学习在Atari视频游戏上的应用[J].电子世界,2017,0(16):105-106. 被引量：3
10刘勇,李青,于翠波.深度学习技术教育应用:现状和前景[J].开放教育研究,2017,23(5):113-120. 被引量：41

同被引文献32

1姚建华,吴加敏,杨勇,施祖贤.全卷积神经网络下的多光谱遥感影像分割[J].中国图象图形学报,2020,0(1):180-192. 被引量：15
2徐明德,陈武.模糊物元法在优选大气监测点中的应用[J].测试技术学报,2007,21(5):391-395. 被引量：8
3刘潘炜,郑君瑜,李志成,钟流举,王雪松.区域空气质量监测网络优化布点方法研究[J].中国环境科学,2010,30(7):907-913. 被引量：27
4赵晓亮,齐庆杰,赵东洋,赵国智,郑娇.阜新市空气监测点位优化的聚类分析[J].地球与环境,2015,43(3):350-355. 被引量：8
5荣光辉,黄震华.基于深度学习的问答匹配方法[J].计算机应用,2017,37(10):2861-2865. 被引量：13
6王毅,谢娟,成颖.结合LSTM和CNN混合架构的深度神经网络语言模型[J].情报学报,2018,37(2):194-205. 被引量：15
7柯昊,李天,周悦,钟玉颖,俞征鹿,袁军鹏.数据缺失时基于BP神经网络的作者重名辨识研究[J].情报学报,2018,37(6):600-609. 被引量：7
8武毅男,方勇纯.基于Preisach模型的深度学习网络迟滞建模[J].控制理论与应用,2018,35(6):723-731. 被引量：12
9杨青,王晨蔚.基于深度学习LSTM神经网络的全球股票指数预测研究[J].统计研究,2019,36(3):65-77. 被引量：101
10袁兆祥,余春生.基于DBSCAN聚类的电力工程数据完整性分析[J].沈阳工业大学学报,2019,41(3):246-250. 被引量：38

引证文献3

1张智军,孙健声,陈博钊.动态收敛微分神经网络帕金森病诊断系统[J].控制理论与应用,2021,38(8):1213-1218. 被引量：1
2杨光友,刘威宏.机器学习理论的超光谱遥感图像无损压缩[J].激光杂志,2022,43(4):109-113. 被引量：1
3李幔,马元婧.基于BiLSTM改进聚类的空气质量监测点位优化[J].计算机系统应用,2022,31(6):217-223. 被引量：3

二级引证文献5

1李伟,匡昌武,胡欣欣.基于RF-BiLSTM神经网络的多时次土壤水分动态预测[J].湖北农业科学,2023,62(4):168-175. 被引量：1
2李伟,匡昌武,陈彦希.基于气象因子的海南岛土壤水分预测模型研究[J].热带农业科学,2023,43(5):84-89.
3陈志奎,杨志朋,陈轩.基于图神经网络聚类的土壤监测点位优化[J].环境保护与循环经济,2024,44(1):72-75.
4徐诗语,张谦,邬依林.面向英文阅读难度分类的神经网络设计与实现[J].现代计算机,2024,30(2):52-59.
5赵美利.基于深度SR模型的加密数字图像压缩与重构[J].成都工业学院学报,2024,27(2):47-51.

1曹文龙,芮建武,李敏.神经网络模型压缩方法综述[J].计算机应用研究,2019,36(3):649-656. 被引量：12
2黄磊,杜昌顺.融合群稀疏与排他性稀疏正则项的神经网络压缩情感分析方法[J].北京化工大学学报（自然科学版）,2019,46(2):103-112. 被引量：4
3黄智勇,吴海华,虞智,仲元红.基于Tiny-yolo的网络压缩与硬件加速方法[J].华南理工大学学报（自然科学版）,2019,47(6):51-56. 被引量：4
4汤凯.临空经济对区域发展的重构效应研究[J].云南财经大学学报,2019,0(7):27-35. 被引量：18
5陈靖,王飞,张儒良.聚集人群人脸检测研究[J].软件导刊,2019,18(4):21-23. 被引量：1
6杨通,郭旭东,岳德鹏,汪晓帆,韩圣其.基于联合变化检测的耕地撂荒信息提取与驱动因素分析[J].农业机械学报,2019,50(6):201-208. 被引量：15
7白润才,柴森霖,刘光伟,付恩三,赵景昌.露天矿行车事故预测方法及应用[J].重庆大学学报（自然科学版）,2019,42(6):88-98.

控制理论与应用

2019年第7期

浏览历史

内容加载中请稍等...

改进聚类的深度神经网络压缩实现方法被引量：3

参考文献2

二级参考文献121

共引文献151

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

改进聚类的深度神经网络压缩实现方法 被引量：3

参考文献2

二级参考文献121

共引文献151

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

改进聚类的深度神经网络压缩实现方法被引量：3