-
题名非光滑凸问题投影型对偶平均优化方法的个体收敛性
被引量:1
- 1
-
-
作者
曲军谊
鲍蕾
陶卿
-
机构
中国人民解放军陆军炮兵防空兵学院信息工程系
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2021年第1期25-32,共8页
-
基金
国家自然科学基金项目(No.61673394,620706252)
安徽省自然科学基金项目(No.1908085MF193)资助。
-
文摘
对于一般凸问题,对偶平均方法的收敛性分析需要在对偶空间进行转换,难以得到个体收敛性结果.对此,文中首先给出对偶平均方法的简单收敛性分析,证明对偶平均方法具有与梯度下降法相同的最优个体收敛速率Ο(ln t√t).不同于梯度下降法,讨论2种典型的步长策略,验证对偶平均方法在个体收敛分析中具有步长策略灵活的特性.进一步,将个体收敛结果推广至随机形式,确保对偶平均方法可有效处理大规模机器学习问题.最后,在L1范数约束的hinge损失问题上验证理论分析的正确性.
-
关键词
对偶平均
个体收敛速率
稀疏性
非光滑
-
Keywords
Dual Averaging
Individual Convergence Rate
Sparsity
Nonsmooth
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于对偶平均的动量方法研究综述
- 2
-
-
作者
曲军谊
-
机构
中国人民解放军陆军炮兵防空兵学院信息工程系
-
出处
《计算机与数字工程》
2022年第11期2443-2448,共6页
-
文摘
对偶平均(dual averaging)方法是一种颇具潜力的优化算法,它巧妙地利用过往所有梯度的信息,克服了传统一阶梯度算法无法摆脱的梯度消失的弊端,并得到稳定的收敛速率。而恰恰类似的是,动量方法同样是利用过往的梯度信息,目的在于在非凸优化问题中能够有效地逃离局部最小点和鞍点,而今年来动量方法也广泛活跃在凸优化领域,不单对一般的梯度下降算法起到加速作用,同时在没有光滑性条件的情况下,得到最优个体收敛速率。论文对对偶平均方法和动量方法的研究现状和存在的问题进行综述,分析两者的联系和区别,并在此基础上指出一些值得研究的问题。
-
关键词
机器学习
对偶平均
动量方法
个体收敛性
稀疏性
-
Keywords
machine learning
dual averaging
momentum method
individual convergence rate
sparsity
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-