神经网络超参数优化的删除垃圾神经元策略被引量：2

Junk-neuron-deletion strategy for hyperparameter optimization of neural networks

下载PDF

导出

摘要随着深度学习处理问题的日益复杂,神经网络的层数、神经元个数、和神经元之间的连接逐渐增加,参数规模急剧膨胀,优化超参数来提高神经网络的预测性能成为一个重要的任务.文献中寻找最优参数的方法如灵敏度剪枝、网格搜索等,算法复杂而且计算量庞大.本文提出一种超参数优化的“删除垃圾神经元策略”.权重矩阵中权重均值小的神经元,在预测中的贡献可以忽略,称为垃圾神经元.该策略就是通过删除这些垃圾神经元得到精简的网络结构,来有效缩短计算时间,同时提高预测准确率和模型泛化能力.采用这一策略,长短期记忆网络模型对几种典型混沌动力系统的预测性能得到显著改善. With the complexity of problems in reality increasing,the sizes of deep learning neural networks,including the number of layers,neurons,and connections,are increasing in an explosive way.Optimizing hyperparameters to improve the prediction performance of neural networks has become an important task.In literatures,the methods of finding optimal parameters,such as sensitivity pruning and grid search,are complicated and cost a large amount of computation time.In this paper,a hyperparameter optimization strategy called junk neuron deletion is proposed.A neuron with small mean weight in the weight matrix can be ignored in the prediction,and is defined subsequently as a junk neuron.This strategy is to obtain a simplified network structure by deleting the junk neurons,to effectively shorten the computation time and improve the prediction accuracy and model the generalization capability.The LSTM model is used to train the time series data generated by Logistic,Henon and Rossler dynamical systems,and the relatively optimal parameter combination is obtained by grid search with a certain step length.The partial weight matrix that can influence the model output is extracted under this parameter combination,and the neurons with smaller mean weights are eliminated with different thresholds.It is found that using the weighted mean value of 0.1 as the threshold,the identification and deletion of junk neurons can significantly improve the prediction efficiency.Increasing the threshold accuracy will gradually fall back to the initial level,but with the same prediction effect,more operating costs will be saved.Further reduction will result in prediction ability lower than the initial level due to lack of fitting.Using this strategy,the prediction performance of LSTM model for several typical chaotic dynamical systems is improved significantly.

作者黄颖顾长贵杨会杰 Huang Ying Gu;Chang-Gui;Yang Hui-Jie(Business School,University of Shanghai for Science and Technology,Shanghai 200093,China)

机构地区上海理工大学管理学院

出处《物理学报》 SCIE EI CAS CSCD 北大核心 2022年第16期77-85,共9页 Acta Physica Sinica

基金国家自然科学基金(批准号:11875042,11505114)资助的课题。

关键词 LSTM 混沌时间序列预测超参数优化删除垃圾神经元策略 LSTM chaotic time series prediction hyperparameter optimization junk neuron deletion strategy

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1邓帅.基于改进贝叶斯优化算法的CNN超参数优化方法[J].计算机应用研究,2019,36(7):1984-1987. 被引量：33
2邵恩泽,吴正勇,王灿.一种改进的神经网络模型结构优化方法[J].工业控制计算机,2020,33(4):11-12. 被引量：3
3乔俊飞,樊瑞元,韩红桂,阮晓钢.机器人动态神经网络导航算法的研究和实现[J].控制理论与应用,2010,27(1):111-115. 被引量：6
4陈国茗,于腾腾,刘新为.带自适应学习率的加速随机方差缩减梯度法[J].数值计算与计算机应用,2021,42(3):215-225. 被引量：1
5王新迎,韩敏.多元混沌时间序列的多核极端学习机建模预测[J].物理学报,2015,64(7):129-135. 被引量：19
6黄伟建,李永涛,黄远.基于混合神经网络和注意力机制的混沌时间序列预测[J].物理学报,2021,70(1):229-237. 被引量：26
7甘文娟,陈永红,韩静,王亚飞.基于正交参数优化的LSTM结构变形预测模型[J].计算机系统应用,2020,29(9):212-218. 被引量：7
8张中华,丁华福.基于混沌神经网络的股票分析及其预测[J].计算机技术与发展,2009,19(3):185-188. 被引量：9

二级参考文献30

1张小桃,倪维斗,李政,郑松.基于现场数据热工对象建模的可辨识性[J].清华大学学报（自然科学版）,2004,44(11):1544-1547. 被引量：16
2张小桃,倪维斗,李政,郑松.基于现场数据与神经网络的热工对象动态建模[J].热能动力工程,2005,20(1):34-37. 被引量：16
3徐耀群,孙明.混沌神经网络时间序列的研究[C]∥中国控制与决策学术年会论文集.沈阳:东北大学出版社,2006:397-402.
4Jiang Jianguo,Shao Kuizhi,Wei Yuheng,et al. Chaotic Neural Network Model for Output Prediction of Polymer Flooding [ C] // Proceedings of the 2007. IEEE, International Conference on Mechatronics and Automation. Harbin, Heilong jiang, China: IEEE, 2007 : 2347 - 2351.
5BAUER A, WOLLHERR D, BUSS M. Human-robot collaboration: a survey[J]. International Journal of Humanoid Robotics, 2008, 5(1): 47 - 66.
6JAN G E, CHANG K Y, PAR.BERRY I. Optimal path planning for mobile robot navigation[J]. IEEE-ASME Transactions on Mechatrioics, 2008, 13(4): 451 - 460.
7BUSONIU L, BABUSKA R, DE SCHUTTER B. A comprehensive survey of multiagent reinforcement learning[J]. IEEE Transactions on Systems, Man and Cybernetics. 2008, 38(2): 156 - 172.
8CARRERSA M, YUB J K, BATLLE J, et al. Application of SONQL for real-time learning of robot behaviors[J]. Robotics and Autonomous System, 2007, 55(8): 628 - 642.
9ARLEO A, SMERALDI E GERSTNER W. Cognitive navigation based on nonuniform Gabor space sampling unsupervised growing networks and reinforcement learning[J]. IEEE Transactions on Neural Networks, 2004, 15(3): 639- 652.
10MAX L, LIKHAREV K K. Global reinforcement learning in neural networks[J]. IEEE Transactions on Neural Networks, 2007, 18(2): 573 - 577.

共引文献96

1赵哲耘,刘玉敏,孙静静.基于混合正交试验的卷积神经网络参数优化[J].统计与决策,2021(8):46-50. 被引量：2
2周勇,赵常辛,张德森,杨越鑫,陈恒阁,孙永鑫.基于SSA—KELM的煤与瓦斯突出预测[J].工矿自动化,2023,49(S02):81-86.
3黄灿,田冷,王恒力,王嘉新,蒋丽丽.基于条件生成式对抗网络的油藏单井产量预测模型[J].计算物理,2022,39(4):465-478. 被引量：1
4何世强,马捷中,曾宪炼.基于改进混沌神经网络的飞机舵面故障预测研究[J].计算机测量与控制,2010,18(5):1011-1013. 被引量：1
5林琦,吴少雄.基于相空间重构的LS-SVM股票价格预测[J].福建工程学院学报,2010,8(3):300-303. 被引量：2
6查春生,倪志伟,倪丽萍,公维峰.基于相空间重构的股价时间序列相关性分析[J].计算机技术与发展,2010,20(8):17-20. 被引量：3
7马明,李松.基于遗传算法优化混沌神经网络的股票指数预测[J].商业研究,2010(11):10-13. 被引量：6
8吴雄华,刘亚.基于BP神经网络的熔喷非织造布工艺参数优化[J].纺织学报,2011,32(1):51-54. 被引量：6
9肖强.基于多尺度稀疏LSSVM的时间序列预测[J].计算机技术与发展,2011,21(3):117-120.
10周业旺.基于混沌神经网络的区域物流量预测[J].商业时代,2012(15):41-42. 被引量：1

同被引文献25

1王超,任伟新.基于动态规划提取信号小波脊和瞬时频率[J].中南大学学报（自然科学版）,2008,39(6):1331-1336. 被引量：7
2赵辉,徐伟东,马铁华,袁伟群,丁伟杰.抑制弧光干扰的电磁炮光幕测速方法[J].火力与指挥控制,2014,39(4):30-33. 被引量：8
3刘爱国,薛云涛,胡江鹭,刘路平.基于GA优化SVM的风电功率的超短期预测[J].电力系统保护与控制,2015,43(2):90-95. 被引量：101
4王锴,刘志国,刘刚,易龙涛,陈曼,彭诗棋.基于自适应层数分解的小波变换滤除冲击信号[J].湖南大学学报（自然科学版）,2015,42(10):65-71. 被引量：7
5白蕊霞,王斌永,童鹏.激光多普勒测速雷达技术研究现状[J].激光与红外,2016,46(3):249-253. 被引量：14
6高巍,李翰山.激光光幕靶探测性能研究[J].计算机与数字工程,2016,44(3):425-428. 被引量：2
7董航,胡云鹏.基于小波变换的信号时频分析与重构[J].中国新通信,2016,18(15):4-5. 被引量：2
8李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：546
9奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465. 被引量：220
10徐龙博,王伟,张滔,杨莉,汪少勇,李煜东.基于神经网络平均影响值的超短期风电功率预测[J].电力系统自动化,2017,41(21):40-45. 被引量：33

引证文献2

1田霖浩,杨俊,郭昊琰.基于Wavelet-CNN的电磁炮过靶信号识别方法[J].计算机测量与控制,2023,31(4):161-166.
2石翔,张暄培,郭磊.基于VMD-SO-BP的超短期风电功率预测[J].红水河,2023,42(3):50-54.

1李沐芸,许哲源.如何用建设性新闻讲好“中国故事”——以中青网“中国人的故事”系列报道为例[J].新闻文化建设,2022(13):27-29.
2王嘉伟,胡曦,丁子怡,刘雨.基于GA-IPSO-BSVM算法的新浪微博评论信息分类[J].计算机系统应用,2022,31(8):169-175. 被引量：1
3刘毅,周小录,刘贵平,刘飞.水电站的水工建筑物监控指标体系分析[J].集成电路应用,2022,39(6):200-201. 被引量：2
4程文辉,车文刚.基于二次分解与LSTM的金融时间序列预测算法研究[J].重庆邮电大学学报（自然科学版）,2022,34(4):638-645. 被引量：4
5王浩祥,邓平.一种基于圆环模型的网格搜索定位算法[J].电讯技术,2022,62(8):1166-1171.
6姚林,张岩,陈龙,韩中洋.基于自适应VMD-注意力机制LSTM的时间序列预测[J].控制工程,2022,29(7):1337-1344. 被引量：4
7姬莉霞,赵耀,马郑祎,赵润哲,张晗.基于iForest-BiLSTM-Attention的数据库负载预测方法[J].郑州大学学报（理学版）,2022,54(6):66-73. 被引量：3
8李强,陈衍姣.基于随机森林的商业性养老保险购买行为预测[J].科技和产业,2022,22(8):271-275.
9邓林,陈玉斌,刘湘慧,陈赟.基于RBF神经网络的地铁隧道施工坍塌事故应急车辆需求预测[J].铁道科学与工程学报,2022,19(7):2100-2106. 被引量：5
10谷茂强,徐安军,刘旋,王慧贤.基于数据驱动的转炉二吹阶段钢水温度动态预测模型[J].工程科学学报,2022,44(9):1595-1606. 被引量：8

物理学报

2022年第16期

浏览历史

内容加载中请稍等...

神经网络超参数优化的删除垃圾神经元策略被引量：2

参考文献8

二级参考文献30

共引文献96

同被引文献25

引证文献2

相关作者

相关机构

相关主题

浏览历史

神经网络超参数优化的删除垃圾神经元策略 被引量：2

参考文献8

二级参考文献30

共引文献96

同被引文献25

引证文献2

相关作者

相关机构

相关主题

浏览历史

神经网络超参数优化的删除垃圾神经元策略被引量：2