基于差分修正的SGDM算法被引量：2

Rectified SGDM Algorithm Based on Difference

下载PDF

导出

摘要当前,应用广泛的一阶深度学习优化器包括学习率非自适应优化器和学习率自适应优化器,前者以SGDM为代表,后者以Adam为代表,这两类方法都使用指数滑动平均法来估计总体的梯度.然而使用指数滑动平均法来估计总体梯度是有偏差且具有滞后性的,本文提出基于差分修正的SGDM算法——RSGDM算法.我们的贡献主要有3点:1)分析SGDM算法里指数滑动平均法带来的偏差和滞后性.2)使用差分估计项来修正SGDM算法里的偏差和滞后性,提出RSGDM算法.3)在CIFAR-10和CIFAR-100数据集上实验证明了在收敛精度上我们的RSGDM算法比SGDM算法更优. Currently,the widely used first-order deep learning optimizers include non-adaptive learning rate optimizers such as SGDM and adaptive learning rate optimizers like Adam,both of which estimate the overall gradient through exponential moving average.However,such a method is biased and hysteretic.In this study,we propose a rectified SGDM algorithm based on difference,i.e.RSGDM.Our contributions are as follows:1)We analyze the bias and hysteresis triggered by exponential moving average in the SGDM algorithm.2)We use the difference estimation term to correct the bias and hysteresis in the SGDM algorithm,and propose the RSGDM algorithm.3)The experiments on CIFAR-10 and CIFAR-100 datasets proves that our RSGDM algorithm is higher than the SGDM algorithm in convergence accuracy.

作者袁炜胡飞 YUAN Wei;HU Fei(School of Mathematics,Tianjin University,Tianjin 300350,China)

机构地区天津大学数学学院

出处《计算机系统应用》 2021年第7期220-224,共5页 Computer Systems & Applications

关键词深度学习一阶优化器 SGDM算法差分 deep learning first order optimization SGDM algorithm difference

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献3

1姜志侠,宋佳帅,刘宇宁.一种改进的自适应动量梯度下降算法[J].华中科技大学学报（自然科学版）,2023,51(5):137-143. 被引量：4
2李禹纬,付锐,刘帆.改进YOLOv7的轻量化交通标志检测算法[J].太原理工大学学报,2024,55(1):195-203. 被引量：1
3李海军,孔繁程,魏嘉彧,林云.基于深度学习的小样本目标检测综述[J].兵工自动化,2024,43(1):35-42. 被引量：1

引证文献2

1黄建勇,周跃进.带有校正项的自适应梯度下降优化算法[J].哈尔滨商业大学学报（自然科学版）,2024,40(2):200-207.
2黄建勇,周跃进.一种改进的带有动量的随机梯度下降优化算法[J].廊坊师范学院学报（自然科学版）,2024,24(2):36-44.

1闫彦.“一带一路”倡议实施初级阶段中国与沿线国家进出口贸易影响研究[J].市场论坛,2020(12):69-72.
2张红峰,刘瀛.基于改进PSInSAR技术的非城区地表形变监测[J].大地测量与地球动力学,2021,41(6):568-571. 被引量：2

计算机系统应用

2021年第7期

浏览历史

内容加载中请稍等...

基于差分修正的SGDM算法被引量：2

同被引文献3

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于差分修正的SGDM算法 被引量：2

同被引文献3

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于差分修正的SGDM算法被引量：2