基于卷积网络的Adam算法的改进被引量：1

Improvement of Adam Algorithm Based on Convolution Network

下载PDF

导出

摘要 Adam算法作为卷积神经网络常用的优化算法,虽具备收敛快的优点,但该算法往往在网络训练后期存在极端学习率,甚至存在不收敛现象.为此提出了Yadamod算法,在Adam算法的二阶动量项中加入激活函数,并采用对学习率进行指数加权平均和增加动态边界的方法,解决了极端学习率问题.使用随机一阶复杂度(SFO)框架对Yadamod算法在随机非凸情况下进行了收敛性分析.基于ResNet-34和ResNet-50卷积神经网络分别在CIFAR-10数据集和CIFAR-100数据集上验证Yadamod算法中的有效性,实验结果表明该算法在稳定性和优化性能方面都优于Adam算法. As a common optimization algorithm of convolutional neural network,Adam algorithm has the advantage of fast convergence,but it often has extreme learning rate in the late stage of network training,and even does not converge.In this paper,Yadamod algorithm is proposed.The activation function is added to the second order momentum term of Adam algorithm,and the method of exponentially weighted average of learning rate and adding dynamic boundary is adopted to solve the problem of extreme learning rate.The convergence of Yadamod algorithm in random non-convex cases is analyzed using the stochastic first-order complexity(SFO)framework.Based on ResNet-34 and ResNet-50 convolutional neural network,the validity of Yadamod algorithm is verified on CIFAR-10 dataset and CIFAR-100 dataset respectively.The experimental results show that the algorithm is superior to Adam algorithm in stability and optimization performance.

作者董文静赵月爱 DONG Wenjing;ZHAO Yueai(School of Mathematics and Statistics,Taiyuan Normal University,Shanxi Jinzhong 030619,China)

机构地区太原师范学院数学与统计学院

出处《太原师范学院学报（自然科学版）》 2023年第3期5-12,共8页 Journal of Taiyuan Normal University:Natural Science Edition

基金国家社科基金项目(ZOBJL080) 山西省“1331工程”平台项目(PT201818) 山西省重点研发计划项目(201803D121088).

关键词激活函数 Adam算法指数加权平均收敛性分析 activation function adam algorithm index weighted average convergence analysis

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1史加荣,王丹,尚凡华,张鹤于.随机梯度下降算法研究进展[J].自动化学报,2021,47(9):2103-2119. 被引量：74
2王奇超,文再文,蓝光辉,袁亚湘.优化算法的复杂度分析[J].中国科学：数学,2020,50(9):1271-1336. 被引量：9
3张珂,杨歆豪,张嘉慧,倪俊芳.基于高次指数平滑动态边界限制的深度学习优化算法[J].信息与控制,2021,50(6):685-693. 被引量：5
4李梓毓,赵月爱.改进Adam优化算法的人脸检测方法[J].太原师范学院学报（自然科学版）,2022,21(4):58-63. 被引量：5
5姜志侠,宋佳帅,刘宇宁.一种改进的自适应动量梯度下降算法[J].华中科技大学学报（自然科学版）,2023,51(5):137-143. 被引量：5

二级参考文献20

1张晴晴,刘勇,潘接林,颜永红.基于卷积神经网络的连续语音识别[J].工程科学学报,2015,37(9):1212-1217. 被引量：70
2陈振宏,兰艳艳,郭嘉丰,程学旗.基于差异合并的分布式随机梯度下降算法[J].计算机学报,2015,38(10):2054-2063. 被引量：20
3朱小辉,陶卿,邵言剑,储德军.一种减小方差求解非光滑问题的随机优化算法[J].软件学报,2015,26(11):2752-2761. 被引量：5
4焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：369
5李飞,高晓光,万开方.基于权值动量的RBM加速学习算法研究[J].自动化学报,2017,43(7):1142-1159. 被引量：11
6景晨凯,宋涛,庄雷,刘刚,王乐,刘凯伦.基于深度卷积神经网络的人脸识别技术综述[J].计算机应用与软件,2018,35(1):223-231. 被引量：94
7亢良伊,王建飞,刘杰,叶丹.可扩展机器学习的并行与分布式优化算法综述[J].软件学报,2018,29(1):109-130. 被引量：29
8林懿伦,戴星原,李力,王晓,王飞跃.人工智能研究的新前线：生成式对抗网络[J].自动化学报,2018,44(5):775-792. 被引量：83
9张荣,李伟平,莫同.深度学习研究综述[J].信息与控制,2018,47(4):385-397. 被引量：139
10谢佩,游科友,洪奕光,谢立华.网络化分布式凸优化算法研究进展[J].控制理论与应用,2018,35(7):918-927. 被引量：21

共引文献93

1朱小勇,陈胜.基于ResNet-ViT的海战多目标态势感知[J].信息与控制,2023,52(5):638-647. 被引量：1
2胡欣然,雷良海,寇晓晨.地方政府债券发行期限影响因素--基于投资者信息不对称视角[J].系统工程,2020,38(2):122-132. 被引量：4
3周瑞敏,王瑞尧,司文杰,李志军.带有改进自适应动量因子的四容水箱DRNN控制系统设计[J].工业控制计算机,2021,34(1):19-22.
4宋立林.序列相关问题的算法设计思路[J].福建电脑,2021,37(1):187-192.
5史加荣,刘晨.基于双核范数鲁棒矩阵分解的遮挡图像恢复[J].山东科技大学学报（自然科学版）,2021,40(4):86-93. 被引量：1
6杨悦,谢辛,何蕾,胡敏.连分式插值结合卷积神经网络的超分辨率重建[J].合肥工业大学学报（自然科学版）,2021,44(8):1146-1152. 被引量：4
7李蝶.基于Polyak步长的方差缩减算法[J].科技资讯,2021,19(16):174-177. 被引量：1
8葛子瑞,杨震,郭振超.一种基于泰勒级数展开的图滤波器设计方法[J].南京邮电大学学报（自然科学版）,2021,41(4):18-26. 被引量：4
9谢小磊,杨毅.求解非凸优化问题的一类带动量步的随机方差缩减算法[J].科技创新导报,2021,18(17):78-81.
10陈国茗,于腾腾,刘新为.带自适应学习率的加速随机方差缩减梯度法[J].数值计算与计算机应用,2021,42(3):215-225. 被引量：1

同被引文献8

1曹风魁,庄严,闫飞,杨奇峰,王伟.移动机器人长期自主环境适应研究进展和展望[J].自动化学报,2020,46(2):205-221. 被引量：36
2盛广润,高国伟,张伯源.基于四元数的四旋翼飞行器姿态解算研究[J].现代电子技术,2020,43(14):8-12. 被引量：11
3王壮飞,卢海林,耿文涛,孙兆群.基于OpenCV的水果采摘机器人目标检测与定位系统研究[J].电子技术与软件工程,2022(2):137-140. 被引量：6
4刘雪纯,刘大铭,常佳鑫,王博.基于MobileNet V2迁移学习的中药材图像识别[J].长江信息通信,2022,35(7):33-37. 被引量：4
5曹月花,李辉.一种基于EdgeBoard的智能车系统设计与实现[J].现代电子技术,2022,45(18):166-170. 被引量：3
6徐一波.AGV小车引导方式的发展趋势分析[J].南方农机,2023,54(16):131-134. 被引量：2
7万琴,李智,李伊康,葛柱,王耀南,吴迪.基于改进YOLOX的移动机器人目标跟随方法[J].自动化学报,2023,49(7):1558-1572. 被引量：5
8张兴华.基于机器视觉的智能物流搬运机器人的设计与研究[J].南方农机,2024,55(5):144-147. 被引量：2

引证文献1

1卓越,赖志芳,张铭,王悦新.基于机器视觉的智能搬运小车[J].电子产品世界,2024,31(3):14-18.

1霍琪.中国省际经济收敛性分析[J].产业创新研究,2023(17):12-14.
2杨兵,郭巧,王伟昌,江本赤.指数加权引出的几类[1/1]阶Padé逼近迭代算法[J].长春师范大学学报,2023,42(8):1-8.
3李得恺,张长胜,杨雪松.融合多策略改进的黏菌优化算法[J].模式识别与人工智能,2023,36(7):647-660. 被引量：3
4兰孝文,张学强,王少锋,徐光.焊缝缺陷超声图谱的卷积神经网络分类研究[J].机械设计与制造,2023(9):79-83.
5李婵娟.我国信息消费发展的时空分异及收敛性研究[J].中国物价,2023(9):35-39.
6曾鹏,庞钰凡.中国城市群经济发展的地区差异及收敛性分析[J].统计与决策,2023,39(17):132-136. 被引量：1
7刘萱,贺飞.强b-距离空间中的Ekeland变分原理[J].应用数学,2023,36(4):877-883. 被引量：1
8王冉,张军武,余亮.组稀疏低秩矩阵估计的变转速滚动轴承故障特征提取[J].振动与冲击,2023,42(16):92-100.
9滕柏路,郭为,曾晶莹,彭越,张晓伟,罗万静,万玉金.页岩气井生产剖面分析及预测模型[J].断块油气田,2023,30(4):586-592.
10燕锋,林晓薇,李正浩,徐霞,夏玮玮,沈连丰.智能电网中基于多智能体强化学习的频谱分配算法[J].通信学报,2023,44(9):12-24. 被引量：2

太原师范学院学报（自然科学版）

2023年第3期

浏览历史

内容加载中请稍等...

基于卷积网络的Adam算法的改进被引量：1

参考文献5

二级参考文献20

共引文献93

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于卷积网络的Adam算法的改进 被引量：1

参考文献5

二级参考文献20

共引文献93

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于卷积网络的Adam算法的改进被引量：1