-
题名基于动态批量评估的绿色无梯度优化方法
- 1
-
-
作者
钱鸿
舒翔
孙天祥
邱锡鹏
周爱民
-
机构
华东师范大学上海智能教育研究院
华东师范大学计算机科学与技术学院
复旦大学计算机科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第4期1732-1750,共19页
-
基金
国家自然科学基金(62106076)
上海市“科技创新行动计划”人工智能科技支撑专项(22511105901)
+1 种基金
CCF-蚂蚁科研基金(CCF-AFSG RF20220205)
上海市自然科学基金(21ZR1420300)。
-
文摘
在基于语言模型即服务的提示词黑盒微调、机器学习模型超参数调节等优化任务中,由于解空间到性能指标之间的映射关系复杂多变,难以显式地构建目标函数,故常采用无梯度优化方法来实现寻优.解的准确、稳定评估是有效实施无梯度优化方法的关键,完成一次解的质量评估常要求在整个数据集上完整运行一次模型,且优化过程有时需要大量评估解的质量.随着机器学习模型复杂度以及训练样本量的不断增加,准确、稳定的解的质量评估时间成本与计算代价越来越高昂,这与绿色低碳机器学习与优化理念背道而驰.有鉴于此,提出了一种基于动态批量评估的绿色无梯度优化方法框架(green derivative-free optimization with dynamic batch evaluation,GRACE),基于训练子集的相似性,在优化过程中自适应动态调节评估解时使用的样本量,使得GRACE在保证优化性能的同时,降低优化成本与代价,达到绿色低碳高效的目标.在语言模型即服务提示词黑盒微调、模型超参数优化等实际任务上进行了实验验证,通过与一系列对比方法以及GRACE消融退化版算法进行比较分析,表明了GRACE的有效性、高效性、绿色低碳性.超参数分析结果表明了其具备超参数稳健性.
-
关键词
无梯度优化
演化学习
绿色低碳
动态批量评估
-
Keywords
derivative-free optimization
evolutionary learning
green and low-carbon
dynamic batch evaluation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-