AccSMBO:一种基于超参梯度和元学习的SMBO加速算法被引量：1

AccSMBO:Using Hyperparameters Gradient and Meta-Learning to Accelerate SMBO

下载PDF

导出

摘要为了利用最佳超参高概率范围和超参梯度,提出了加速的序列模型优化算法(sequential model-based optimization algorithms,SMBO)——AccSMBO算法.AccSMBO使用了具有良好抗噪能力的基于梯度的多核高斯过程回归方法,利用元学习数据集的meta-acquisition函数.AccSMBO自然对应的并行算法则使用了基于元学习数据集的并行算法资源调度方案.基于梯度的多核高斯过程回归可以避免超参梯度噪音对拟合高斯过程的影响,加快构建较好超参效果模型的速度.meta-acquisition函数通过读取元学习数据集,总结最佳超参高概率范围,加快最优超参搜索.在AccSMBO自然对应的并行算法中,并行资源调度方法使更多的并行计算资源用于计算最佳超参高概率范围中的超参,更快探索最佳超参高概率范围.上述3个技术充分利用超参梯度和最佳超参高概率范围加速SMBO算法.在实验中,相比于基于传统的SMBO算法实现的SMAC(sequential model-based algorithm configuration)算法、基于梯度下降的HOAG(hyperparameter optimization with approximate gradient)算法和常用的随机搜索算法,AccSMBO使用最少的资源找到了效果最好的超参. Current machine learning models require numbers of hyperparameters.Adjusting those hyperparameters is an exhausting job.Thus,hyperparameters optimization algorithms play important roles in machine learning application.In hyperparameters optimization algorithms,sequential model-based optimization algorithms(SMBO)and parallel SMBO algorithms are state-of-the-art hyperpara-meter optimization methods.However,(parallel)SMBO algorithms do not take the best hyperpara-meters high possibility range and gradients into considerasion.It is obvious that best hyperparameters high possibility range and hyperparameter gradients can accelerate traditional hyperparameters optimization algorithms.In this paper,we accelerate the traditional SMBO method and name our method as AccSMBO.In AccSMBO,we build a novel gradient-based multikernel Gaussian process.Our multikernel Gaussian process has a good generalization ability which reduces the gradient noise influence on SMBO algorithm.And we also design meta-acquisition function and parallel resource allocation plan which encourage that(parallel)SMBO puts more attention on the best hyperpara-meters high possibility range.In theory,our method ensures that all hyperparameter gradient information and the best hyperparameters high possibility range information are fully used.In L2 norm regularised logistic loss function experiments,on different scales datasets:small-scale dataset Pc4,middle-scale dataset Rcv1,large-scale dataset Real-sim,compared with state-of-the-art gradient based algorithm:HOAG and state-of-the-art SMBO algorithm:SMAC,our method exhibits the best performance.

作者程大宁张汉平夏粉李士刚袁良张云泉 Cheng Daning;Zhang Hanping;Xia Fen;Li Shigang;Yuan Liang;Zhang Yunquan(University of Chinese Academy of Sciences,Beijing 100190;Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190;Wisdom Uranium Technology Co.Ltd,Beijing 100190;Swiss Federal Institute of Technology Zurich,Zurich,Switzerland 8914;University at Buffalo,The State University of New York,New York 14260)

机构地区中国科学院大学中国科学院计算技术研究所智铀科技有限公司苏黎世理工大学纽约州立大学布法罗分校

出处《计算机研究与发展》 EI CSCD 北大核心 2020年第12期2596-2609,共14页 Journal of Computer Research and Development

基金国家自然科学基金项目(61432018,61521092,61272136,61521092,61502450) 国家重点研发计划项目(2016YFB0200803) 北京自然科学基金项目(L1802053)。

关键词 AutoML技术 SMBO算法黑箱调优算法超参梯度元学习并行资源调度 AutoML SMBO black box optimization hypergradient metalearning parallel resource allocation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP302.7 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：612

二级参考文献14

1MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
2MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
3李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
410 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
5Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
6Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
7Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
8Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.
9LeCun y, Boser B, DenkerJ S. et a1. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989, I: 541-551.
10Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)[OLJ.[2013-08-01J. http://www. image?net.org/challenges/LSVRC/2012/.

共引文献611

1贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
2毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
3范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
4孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1
5华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
6刘树霄,衣立,张苏平,时晓曚,薛允传.基于全卷积神经网络方法的日间黄海海雾卫星反演研究[J].海洋湖沼通报,2019(6):13-22. 被引量：12
7王海涛.自主无人系统——概念、体系架构和设计要素[J].电信快报,2021(5):6-9.
8郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
9李佳意,董万鹏,任梦,张吉超,弓成美琪.新时代计算机智能制造模式的研究进展[J].智能计算机与应用,2021,11(3):98-105. 被引量：1
10唐公田.杏砧杏快速育苗新技术[J].科技致富向导,2000(4):26-26.

同被引文献7

1赵柏山,刘晓晓,张学松.一种限定混沌状态变量运动区域的方法[J].沈阳工业大学学报,2019,41(1):62-67. 被引量：3
2于艺铭,金典,王琪,张琪,陈茜,王小菊.Lab分通道直方图的彩色图像分割算法及应用[J].影像科学与光化学,2019,37(1):18-32. 被引量：9
3夏世威,徐英,郭志忠,李庚银.多维导数阶数控制的多步Taylor级数暂态稳定计算方法[J].电力系统及其自动化学报,2019,31(3):107-112. 被引量：4
4张雪,朱向鹏,刘帅,闫锋刚,王军.四元数矩阵重构鲁棒波束形成算法[J].哈尔滨工业大学学报,2020,52(5):23-29. 被引量：2
5王建平,赵烜,胡海,吴良益,郭栋,李瑜.基于MATLAB的人体膝关节运动捕捉测量与分析[J].河南理工大学学报（自然科学版）,2020,39(3):86-93. 被引量：8
6俞莎莎,朱如鹏,李苗苗,陈健,解超.基于机器视觉的齿面点蚀面积特征提取的研究[J].机械制造与自动化,2020,49(1):87-90. 被引量：7
7李由,王春慧,严曲,张小虎,谢良.SpaceMocap:在轨人体运动捕捉系统[J].宇航学报,2019,40(6):725-732. 被引量：7

引证文献1

1张江伟,刘永庆.基于均值位移算法的体育运动训练轨迹数据捕捉方法[J].自动化技术与应用,2023,42(2):49-51. 被引量：1

二级引证文献1

1李霞.新兴技术在体育训练中的应用与效果评估[J].当代体育科技,2024,14(13):34-37.

1黄亚,易灵,肖伟华,侯贵兵,李媛媛.基于高斯过程回归模型的径流短期预测研究[J].水力发电,2020,46(12):9-12. 被引量：5
2黄诗娟.探讨高中生物课堂教学中对核心素养“生命观念”的培养[J].高考,2020,0(21):23-23. 被引量：2
3名论[J].中国名牌,2020(9):16-17.
4张孝山.微电网多能互补经济运行策略的应用[J].电子技术与软件工程,2020(18):215-216. 被引量：1
5陈强峰.支持向量机自寻优模型在锅炉一次风量预测中的应用[J].电力设备管理,2020(11):99-100.
6吴国伟,辜青青.江西柑桔产业现状与发展对策[J].现代园艺,2020,43(23):76-78. 被引量：6
7CHEN RuiJuan,YANG Tao,CHAI Tian You.Distributed accelerated optimization algorithms:Insights from an ODE[J].Science China(Technological Sciences),2020,63(9):1647-1655. 被引量：4
8李聪波,尹誉先,肖溱鸽,龙云,赵希坤.数据驱动下基于元动作的数控车削能耗预测方法[J].中国机械工程,2020,31(21):2601-2611. 被引量：17
9杨帆.随机搜索算法在医疗器械人性化色泽设计中的应用[J].电子测量技术,2020,43(17):92-96. 被引量：1
10郑健壮,吴文雯.独角兽企业成长关键因素的实证研究[J].科技管理研究,2020,40(21):225-232. 被引量：9

计算机研究与发展

2020年第12期

浏览历史

内容加载中请稍等...

AccSMBO:一种基于超参梯度和元学习的SMBO加速算法被引量：1

参考文献1

二级参考文献14

共引文献611

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

AccSMBO:一种基于超参梯度和元学习的SMBO加速算法 被引量：1

参考文献1

二级参考文献14

共引文献611

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

AccSMBO:一种基于超参梯度和元学习的SMBO加速算法被引量：1