基于自适应学习率优化的AdaNet改进被引量：5

Improved AdaNet based on adaptive learning rate optimization

下载PDF

导出

摘要人工神经网络的自适应结构学习(AdaNet)是基于Boosting集成学习的神经结构搜索框架,可通过集成子网创建高质量的模型。现有的AdaNet所产生的子网之间的差异性不显著,因而限制了集成学习中泛化误差的降低。在AdaNet设置子网网络权重和集成子网的两个步骤中,使用Adagrad、RMSProp、Adam、RAdam等自适应学习率方法来改进现有AdaNet中的优化算法。改进后的优化算法能够为不同维度参数提供不同程度的学习率缩放,得到更分散的权重分布,以增加AdaNet产生子网的多样性,从而降低集成学习的泛化误差。实验结果表明,在MNIST(Mixed National Institute of Standards and Technology database)、Fashion-MNIST、带高斯噪声的Fashion-MNIST这三个数据集上,改进后的优化算法能提升AdaNet的搜索速度,而且该方法产生的更加多样性的子网能提升集成模型的性能。在F1值这一评估模型性能的指标上,改进后的方法相较于原方法,在三种数据集上的最大提升幅度分别为0.28%、1.05%和1.10%。 AdaNet(Adaptive structural learning of artificial neural Networks)is a neural architecture search framework based on Boosting ensemble learning,which can create high-quality models through integrated subnets.The difference between subnets generated by the existing AdaNet is not significant,which limits the reduction of generalization error in ensemble learning.In the two steps of AdaNet:setting subnet network weights and integrating subnets,Adagrad,RMSProp(Root Mean Square Prop),Adam,RAdam(Rectified Adam)and other adaptive learning rate methods were used to improve the existing optimization algorithms in AdaNet.The improved optimization algorithms were able to provide different degrees of learning rate scaling for different dimensional parameters,resulting in a more dispersed weight distribution,so as to increase the diversity of subnets generated by AdaNet,thereby reducing the generalization error of ensemble learning.The experimental results show that on the three datasets:MNIST(Mixed National Institute of Standards and Technology database),Fashion-MNIST and Fashion-MNIST with Gaussian noise,the improved optimization algorithms can improve the search speed of AdaNet,and more diverse subnets generated by the method can improve the performance of the ensemble model.For the F1 value,which is an index to evaluate the model performance,compared with the original method,the improved methods have the largest improvement of 0.28%,1.05%and 1.10%on the three datasets.

作者刘然刘宇顾进广 LIU Ran;LIU Yu;GU Jinguang(College of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan Hubei 430065,China;Key Laboratory of Intelligent Information Processing and Real-time Industrial System in Hubei Province(Wuhan University of Science and Technology),Wuhan Hubei 430065,China;Institute of Big Data Science and Engineering,Wuhan University of Science and Technology,Wuhan Hubei 430065,China;Key Laboratory of Rich-media Knowledge Organization and Service of Digital Publishing Content,National Press and Publication Administration(Wuhan University of Science and Technology),Beijing 100038,China)

机构地区武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学) 武汉科技大学大数据科学与工程研究院国家新闻出版署富媒体数字出版内容组织与知识服务重点实验室(武汉科技大学)

出处《计算机应用》 CSCD 北大核心 2020年第10期2804-2810,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(U1836118,61673004) 教育部新一代信息技术创新项目(2018A03025) 国家社会科学基金重大计划项目(11&ZD189)。

关键词 AdaNet 神经架构搜索集成学习自适应学习率方法自动机器学习 AdaNet Neural Architecture Search(NAS) ensemble learning adaptive learning rate method Automated Machine Learning(AutoML)

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1朱振国,田松禄.基于权值变化的BP神经网络自适应学习率改进研究[J].计算机系统应用,2018,27(7):205-210. 被引量：17
2金海东,刘全,陈冬火.一种带自适应学习率的综合随机梯度下降Q-学习方法[J].计算机学报,2019,42(10):2203-2215. 被引量：15
3仝卫国,李敏霞,张一可.深度学习优化算法研究[J].计算机科学,2018,45(B11):155-159. 被引量：38

二级参考文献13

1魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
2贾楠,胡红萍,白艳萍.基于BP神经网络的人口预测[J].山东理工大学学报（自然科学版）,2011,25(3):22-24. 被引量：14
3傅启明,刘全,王辉,肖飞,于俊,李娇.一种基于线性函数逼近的离策略Q(λ)算法[J].计算机学报,2014,37(3):677-686. 被引量：25
4刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：287
5李雪芝,周建平,许燕,王博.基于L-M算法的BP神经网络预测短电弧加工表面质量模型[J].燕山大学学报,2016,40(4):296-300. 被引量：14
6潘庆先,董红斌,韩启龙,王莹洁,丁蕊.一种基于BP神经网络的属性重要性计算方法[J].中国科学技术大学学报,2017,47(1):18-25. 被引量：28
7胡燕祝,李雷远.Kalman滤波-BP神经网络在执行机构自主定位中的应用[J].北京邮电大学学报,2016,39(6):110-115. 被引量：3
8李新叶,黄腾.基于多尺度跃层卷积神经网络的精细车型识别[J].科学技术与工程,2017,17(11):246-249. 被引量：7
9朱志鹏,喻芳,曾青霞,杜建强.基于深度学习与偏最小二乘的分析方法及其医学应用[J].江西中医药大学学报,2017,29(3):94-97. 被引量：2
10杨志浩,李治平.基于BP神经网络的底水油藏控水压裂选段新方法[J].地质与勘探,2017,53(4):818-824. 被引量：15

共引文献66

1张戎秋.基于改进的BP神经网络的图像检索技术研究[J].淮南师范学院学报,2019,21(2):110-111.
2贾桐.深度学习常用优化算法研究[J].信息技术与网络安全,2019,38(7):42-46. 被引量：9
3王林,和萌.基于改进混合高斯模型与阴影去除的目标检测[J].计算机测量与控制,2019,27(7):50-53. 被引量：5
4张德,李国璋,王怀光,张峻宁.位姿估计自适应学习率的改进[J].电子测量与仪器学报,2019,31(6):51-58. 被引量：4
5梁昱,李彬彬,陈志高,焦斌.TensorFlow中深度前馈网络优化研究及其轴承故障诊断应用[J].计算机应用与软件,2019,36(10):175-182. 被引量：5
6吴思凡,杜煜,徐世杰,杨硕,杜晨.基于长短期记忆-异步优势动作评判的智能车汇入模型[J].汽车技术,2019(10):42-47.
7娄奥,姚敏立,袁丁.基于改进的BP算法的非线性稳定环辨识[J].电光与控制,2019,26(11):15-18. 被引量：4
8岳廷妍,张昱勤,李晓松,马越,张韬.数据缺失机制识别及处理的标准化流程及集成系统[J].现代预防医学,2019,46(21):3928-3932. 被引量：1
9耿聪慧.基于BP神经网络的会计信息质量评价[J].财会通讯（上）,2019(11):107-111. 被引量：3
10张天柱,邹承明.使用模糊聚类的胶囊网络在图像分类上的研究[J].计算机科学,2019,46(12):279-285. 被引量：10

同被引文献51

1阎平凡.对多层前向神经网络研究的几点看法[J].自动化学报,1997,23(1):129-135. 被引量：34
2刘艳忠,邵小健,李旭宏.基于Lagrange支持向量回归机的短时交通流量预测模型的研究[J].交通与计算机,2007,25(5):46-49. 被引量：13
3许伦辉,唐德华,邹娜,夏新海.基于非线性时间序列分析的短时交通流特性分析[J].重庆交通大学学报（自然科学版）,2010,29(1):110-113. 被引量：5
4ZHAO Junhui,GUAN Xin,LI Xiuping.Power Allocation Based on Genetic Simulated Annealing Algorithm in Cognitive Radio Networks[J].Chinese Journal of Electronics,2013,22(1):177-180. 被引量：7
5阚威,李云.基于LSTM的脑电情绪识别模型[J].南京大学学报（自然科学版）,2019,55(1):110-116. 被引量：17
6黄斌,孙永荣,杨博文,王潇潇,刘晓俊.迭代最小二乘椭圆拟合的锥套图像检测与跟踪[J].中国图象图形学报,2014,19(8):1202-1209. 被引量：14
7贲晛烨,杨明强,张鹏,李娟.微表情自动识别综述[J].计算机辅助设计与图形学学报,2014,26(9):1385-1395. 被引量：44
8全权,魏子博,高俊,张瑞峰,蔡开元.软管式自主空中加油对接阶段中的建模与控制综述[J].航空学报,2014,35(9):2390-2410. 被引量：49
9彭进业,杨瑞靖,冯晓毅,王文星,彭先霖.人脸疼痛表情识别综述[J].数据采集与处理,2016,31(1):43-55. 被引量：14
10郭潇逍,李程,梅俏竹.深度学习在游戏中的应用[J].自动化学报,2016,42(5):676-684. 被引量：22

引证文献5

1李磊,张青苗,赵军辉,聂逸文.基于改进CNN-LSTM组合模型的分时段短时交通流预测[J].应用科学学报,2021,39(2):185-198. 被引量：26
2张怡,孙永荣,赵科东,李华,曾庆化.空中加油场景下的目标联合检测跟踪算法[J].计算机应用,2022,42(9):2893-2899. 被引量：1
3黄豪豪,李铭田,张富春.优化算法在人脸表情识别中的应用研究[J].延安大学学报（自然科学版）,2022,41(3):56-60.
4王璐,梁明晶,石慧宇,温昕,曹锐.基于脑电时频空多域特征融合的情感识别研究[J].计算机工程与应用,2023,59(4):191-196. 被引量：3
5高哲,剪静.基于Borges差分的RMSprop算法及在卷积神经网络参数训练中的应用[J].辽宁大学学报（自然科学版）,2023,50(1):1-9.

二级引证文献30

1袁子豪,曾小清,保丽霞,郭烨鑫,盛峰.多影响因素下的交通枢纽客流短期预测算法[J].交通与运输,2023,39(S01):99-104.
2王雅兰,田野,杨丽华.基于DA-CNNGRU混合神经网络的超短期风电场功率预测方法[J].湖北电力,2021,45(3):23-28. 被引量：10
3郭佳丽,邢双云,栾昊,贾艳婷.基于改进的LSTM算法的时间序列流量预测[J].南京信息工程大学学报（自然科学版）,2021,13(5):571-575. 被引量：8
4王博文,王景升,朱茵,王统一,张泽有.基于ARMA-SVR的短时交通流量预测模型研究[J].公路交通科技,2021,38(11):126-133. 被引量：15
5王方伟,陈景雅,谢敏慧,石宝存.基于PCA-GRA-AdaBoost的交通流预测模型研究[J].河南科学,2022,40(3):396-402. 被引量：1
6申慧涛,郑亮,李树凯,王璞.基于生成对抗网络的地铁OD需求短时预测[J].铁道科学与工程学报,2022,19(6):1530-1539. 被引量：1
7张龄允,韩莹,张凯,卢海鹏,丁昱杰.基于深度学习的短时交通流预测模型[J].计算机与现代化,2022(7):54-60. 被引量：1
8王雨松,吴向东,尤晨欣,廖聪.基于DWT-GCN的短时交通流预测[J].计算机系统应用,2022,31(9):306-312. 被引量：2
9韩佳豪,陈小华,姜海斌,李霖,李振,张皓,赵涓涓.基于卷积长短期记忆网络的泄漏监测算法研究[J].太原理工大学学报,2022,53(5):924-932. 被引量：1
10李静宜,丁飞,张楠,李湘媛,顾潮.基于深度LSTM与遗传算法融合的短期交通流预测模型[J].无线电通信技术,2022,48(5):836-843. 被引量：3

1杨海龙,田莹,王澧冰.目标检测模型的优化训练方法研究[J].辽宁科技大学学报,2020,43(2):129-134.
2Control Theory and Technology Editorial Board[J].Control Theory and Technology,2020,18(3).
3Chinese Journal of Electronics[J].Chinese Journal of Electronics,2020,29(5).
4肖仁鑫,宋新月,张梦帆,夏雪磊,肖佳鹏.基于长短期记忆神经网络的健康状态估算[J].农业装备与车辆工程,2020,58(4):77-81. 被引量：1
5秦觅.面向企业创新的搜索引擎的研究与应用[J].科学与信息化,2020(29):179-179.
6孙洲鑫,王文松.深度学习中激活函数权重初始值的选取[J].信息技术与信息化,2020(9):100-102. 被引量：5
7廖雪超,周游,陈振寰.基于ADRC的改进自学习薄膜厚度控制模型[J].计算机仿真,2020,37(8):141-147.
8吕磊,李文彬,王晓鸣,胡隆基.基于深度卷积神经网络的小样本车型分类方法[J].兵器装备工程学报,2020,41(8):193-200. 被引量：4
9张海鹏,朱家明.基于分散风险对多只股票组合投资策略的优化设计[J].河南科技学院学报（自然科学版）,2020,48(4):62-70. 被引量：1
10周文佳,熊辉,陆小龙,倪力力.桃红四物汤拆方对高龄股骨粗隆间骨折术后隐性失血的影响[J].山西中医,2020,36(10):21-24. 被引量：1

计算机应用

2020年第10期

浏览历史

内容加载中请稍等...

基于自适应学习率优化的AdaNet改进被引量：5

参考文献3

二级参考文献13

共引文献66

同被引文献51

引证文献5

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于自适应学习率优化的AdaNet改进 被引量：5

参考文献3

二级参考文献13

共引文献66

同被引文献51

引证文献5

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

基于自适应学习率优化的AdaNet改进被引量：5