期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
求解一类非光滑凸优化问题的相对加速SGD算法
1
作者 张文娟 冯象初 +2 位作者 肖锋 黄姝娟 李欢 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期147-157,共11页
一阶优化算法由于其计算简单、代价小,被广泛应用于机器学习、大数据科学、计算机视觉等领域,然而,现有的一阶算法大多要求目标函数具有Lipschitz连续梯度,而实际中的很多应用问题不满足该要求。在经典的梯度下降算法基础上,引入随机和... 一阶优化算法由于其计算简单、代价小,被广泛应用于机器学习、大数据科学、计算机视觉等领域,然而,现有的一阶算法大多要求目标函数具有Lipschitz连续梯度,而实际中的很多应用问题不满足该要求。在经典的梯度下降算法基础上,引入随机和加速,提出一种相对加速随机梯度下降算法。该算法不要求目标函数具有Lipschitz连续梯度,而是通过将欧氏距离推广为Bregman距离,从而将Lipschitz连续梯度条件减弱为相对光滑性条件。相对加速随机梯度下降算法的收敛性与一致三角尺度指数有关,为避免调节最优一致三角尺度指数参数的工作量,给出一种自适应相对加速随机梯度下降算法。该算法可自适应地选取一致三角尺度指数参数。对算法收敛性的理论分析表明,算法迭代序列的目标函数值收敛于最优目标函数值。针对Possion反问题和目标函数的Hessian阵算子范数随变量范数多项式增长的极小化问题的数值实验表明,自适应相对加速随机梯度下降算法和相对加速随机梯度下降算法的收敛性能优于相对随机梯度下降算法。 展开更多
关键词 凸优化 非光滑优化 相对光滑 随机规划 梯度方法 加速随机梯度下降
下载PDF
基于鲁棒控制的自适应分数阶梯度优化算法设计
2
作者 刘佳旭 陈嵩 +2 位作者 蔡声泽 许超 褚健 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第7期1187-1196,共10页
当目标函数是强凸函数时,一般的分数阶梯度下降法不能够使函数收敛到最小值点,只能收敛到一个包含最小值点的区域内或者是发散的.为了解决这个问题,本文提出了自适应分数阶梯度下降法(AFOGD)和自适应分数阶加速梯度下降法(AFOAGD)两种... 当目标函数是强凸函数时,一般的分数阶梯度下降法不能够使函数收敛到最小值点,只能收敛到一个包含最小值点的区域内或者是发散的.为了解决这个问题,本文提出了自适应分数阶梯度下降法(AFOGD)和自适应分数阶加速梯度下降法(AFOAGD)两种新的优化算法.受到鲁棒控制理论中二次约束和李雅普诺夫稳定性理论的启发,建立了一个线性矩阵不等式去分析所提出的算法的收敛性.当目标函数是L-光滑且m-强凸时,算法可以达到R线性收敛.最后几个数值仿真证明了算法的有效性和优越性. 展开更多
关键词 梯度下降法 自适应算法 鲁棒控制 分数阶微积分 加速算法
下载PDF
基于改进AGD-分布式多智能体系统的目标优化分配模型 被引量:6
3
作者 刘家义 王刚 +2 位作者 张杰 王闯 宋喜团 《系统工程与电子技术》 EI CSCD 北大核心 2020年第4期863-870,共8页
由于现代化战场环境动态多变、作战实时性高,针对当前防空作战中武器目标分配(weapon target assignment,WTA)约束多且复杂、传统建模无法真实反映战争过程、模型可信度不高等问题,提出一种在分布式约束优化问题(distributed constraint... 由于现代化战场环境动态多变、作战实时性高,针对当前防空作战中武器目标分配(weapon target assignment,WTA)约束多且复杂、传统建模无法真实反映战争过程、模型可信度不高等问题,提出一种在分布式约束优化问题(distributed constraint optimization problem,DCOP)背景下,基于多智能体系统(multi-Agent system,MAS)理论的武器目标优化分配模型,并利用改进的加速梯度下降(accelerated gradient descent,AGD)算法进行求解。通过实验证明了该算法具有良好的收敛性和低复杂度,能够适应现代化防空作战的需求,满足大规模寻优问题的需求,高效解决多智能体目标优化分配问题。 展开更多
关键词 多智能体系统 分布式约束优化问题 武器目标分配 加速梯度下降
下载PDF
点至平面代数曲线正交投影计算的混合算法
4
作者 吴志男 李小武 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第5期726-737,共12页
点至平面代数曲线的正交投影计算在计算机图形学、计算机辅助几何设计领域,特别是交互式设计等应用中有着非常重要而广泛的运用.基于牛顿梯度下降法、切线和曲率圆形成中点的中点脚点法,以及混合几何加速正交法的计算方法,提出一种混合... 点至平面代数曲线的正交投影计算在计算机图形学、计算机辅助几何设计领域,特别是交互式设计等应用中有着非常重要而广泛的运用.基于牛顿梯度下降法、切线和曲率圆形成中点的中点脚点法,以及混合几何加速正交法的计算方法,提出一种混合算法用于计算点到平面代数曲线的正交投影问题.首先,采用牛顿梯度下降法使初始迭代点落在平面代数曲线上;其次,利用切线和曲率圆所形成的中点作为脚点,再结合牛顿梯度下降法,将落在平面代数曲线上的迭代点逐渐挪动至正交投影点很靠近位置;最后,使用混合几何加速正交法得到正交投影点.采用3个封闭平面代数曲线实例进行实验,通过收敛性计算验证,结果表明当测试点比较远或代数曲线次数比较高时,该算法是鲁棒和高效的. 展开更多
关键词 点正交投影 平面代数曲线 牛顿梯度下降法 混合几何加速正交法 曲率圆
下载PDF
改进扩展卡尔曼滤波的四旋翼姿态估计算法 被引量:19
5
作者 王龙 章政 王立 《计算机应用》 CSCD 北大核心 2017年第4期1122-1128,共7页
为了提高标准扩展卡尔曼姿态估计算法的精确度和快速性,将运动加速度抑制的动态步长梯度下降算法融入扩展卡尔曼中,提出一种改进扩展卡尔曼的四旋翼姿态估计算法。该算法在卡尔曼测量更新中采用梯度下降法进行非线性观测,消除标准扩展... 为了提高标准扩展卡尔曼姿态估计算法的精确度和快速性,将运动加速度抑制的动态步长梯度下降算法融入扩展卡尔曼中,提出一种改进扩展卡尔曼的四旋翼姿态估计算法。该算法在卡尔曼测量更新中采用梯度下降法进行非线性观测,消除标准扩展卡尔曼算法在线性化时带来的线性化误差,提高算法的准确性和快速性;对梯度下降法的梯度步长进行动态处理,使算法步长与四旋翼飞行器的运动合角速度成正比,增强微型四旋翼飞行器姿态解算的动态性能;对强机动运动过程中机体产生的运动加速度进行抑制处理,消除运动加速度对姿态解算的不利影响,提高了微型四旋翼飞行器姿态解算的跟踪精度。为了验证所设计算法的可行性和有效性,基于STM32单片机搭建四旋翼实验平台系统进行实时在线性能验证。结果表明,所设计算法能提高四旋翼飞行器在强机动、高速运动情况下的姿态跟踪精度、动态性能,增强姿态融合算法的抗干扰性,保证微型四旋翼飞行器的稳定飞行。 展开更多
关键词 四旋翼飞行器 扩展卡尔曼滤波器 运动加速度抑制 动态步长 梯度下降法
下载PDF
自适应梯度下降观测矩阵优化算法 被引量:5
6
作者 蒋伊琳 佟岐 +2 位作者 张荣兵 王海艳 汲清波 《计算机应用研究》 CSCD 北大核心 2017年第7期1950-1952,共3页
基于可以通过减小压缩感知中观测矩阵与稀疏矩阵之间的互相关性来提高信号的重构质量,结合无约束凸优化问题中梯度下降的思想,提出了一种自适应梯度下降算法(adaptive gradient descent,AGD)。首先利用等角紧框架(equiangular tight fra... 基于可以通过减小压缩感知中观测矩阵与稀疏矩阵之间的互相关性来提高信号的重构质量,结合无约束凸优化问题中梯度下降的思想,提出了一种自适应梯度下降算法(adaptive gradient descent,AGD)。首先利用等角紧框架(equiangular tight frame,ETF)收缩传感矩阵的Gram矩阵,然后通过收缩得到的Gram矩阵建立一个无约束凸优化问题,最后通过梯度下降方法求解无约束凸优化问题进而得到优化后的观测矩阵。AGD算法通过每次更新梯度下降的方向,使Gram矩阵能够在最短时间内逼近ETF。仿真实验表明,该算法不仅迭代次数少,且优化后的观测矩阵与稀疏矩阵之间的互相关性大大降低。与传统的优化算法相比,信号恢复效果更好。 展开更多
关键词 压缩感知 观测矩阵 自适应梯度下降 互相关性 等角紧框架
下载PDF
基于对角递归神经网络的汽车主动悬架控制 被引量:4
7
作者 丁惜瀛 王春强 李琳 《沈阳工业大学学报》 EI CAS 北大核心 2015年第1期6-10,共5页
为了提高电动汽车行驶平顺性及操纵稳定性,针对电动汽车悬架进行振动分析,建立了七自由度汽车电动主动悬架模型,设计四轮全驱电动汽车电动主动悬架结构及其控制系统.重点针对电动汽车主动悬架特点设计对角递归神经网络(DRNN)控制器,选... 为了提高电动汽车行驶平顺性及操纵稳定性,针对电动汽车悬架进行振动分析,建立了七自由度汽车电动主动悬架模型,设计四轮全驱电动汽车电动主动悬架结构及其控制系统.重点针对电动汽车主动悬架特点设计对角递归神经网络(DRNN)控制器,选取车身垂向加速度、悬架动行程和轮胎动行程作为神经网络控制器输入,采用梯度下降法对神经网络权值进行在线调整.仿真结果表明,具有DRNN控制器的电动主动悬架控制效果较PID控制主动悬架和被动悬架有显著提高,有效改善了汽车行驶平顺性及操纵稳定性,也说明所设计的控制策略在电动汽车电动主动悬架控制方面的有效性. 展开更多
关键词 对角递归神经网络 主动悬架 自由度 四轮全驱 加速度 动行程 梯度下降法 被动悬架
下载PDF
基于社会媒体内容和网络拓扑的特定话题推特摘要研究 被引量:1
8
作者 贺瑞芳 段兴义 +1 位作者 张雪菲 赵文丽 《计算机学报》 EI CSCD 北大核心 2019年第6期1174-1189,共16页
推特摘要旨在从话题相关的社会媒体短文本中提炼概要的推文集,以获取有效信息,可用于舆情监控、竞争情报分析及电子商务等.然而社会媒体的海量、嘈杂及不规范性使得仅依赖纯文本的传统摘要方法难以直接迁移到社交媒体情景中;而现有的推... 推特摘要旨在从话题相关的社会媒体短文本中提炼概要的推文集,以获取有效信息,可用于舆情监控、竞争情报分析及电子商务等.然而社会媒体的海量、嘈杂及不规范性使得仅依赖纯文本的传统摘要方法难以直接迁移到社交媒体情景中;而现有的推特摘要方法很少考虑数据稀疏性和社会网络传播带来的强冗余性,鲜有通过挖掘推文之间潜在的社会网络结构关系进行文摘内容选择,忽略了信息可以沿着社交网络进行传播.受压缩感知及社会学理论的启发,该文提出基于社会网络和稀疏重构的推特摘要方法(SNSR)以更好地融合社会媒体内容和结构信息.首先,挖掘推文中隐含的摘要模式,将其建模为组稀疏正则项,以捕捉代表性的推特摘要组合;其次,建模社会网络中表达一致性与表达传染性为社会化正则项,以探索推文之间的潜在网络结构关系在推特摘要中的作用;再次,建模社会媒体信息传播带来的强冗余性为多样性正则项,进而将这些约束整合到稀疏重构的推特摘要框架中;最后,提出基于Nesterov加速梯度下降的推特摘要算法,以解决推特摘要优化框架中的覆盖性、稀疏性以及多样性等问题.同时,由于推特摘要标准语料的缺乏,作者建设了12个话题的评测数据集.相关的实验结果证明了文中提出方法的有效性. 展开更多
关键词 推特摘要 稀疏重构 网络拓扑 社会学理论 Nesterov加速梯度下降算法
下载PDF
面向智能监控的运动目标轮廓可靠提取
9
作者 夏海英 颜远辉 +1 位作者 黄思奇 肖雯静 《广西师范大学学报(自然科学版)》 CAS 北大核心 2014年第4期39-44,共6页
针对目标运动检测算法得到的运动目标轮廓存在轮廓不完整、不准确等问题,本文提出一种基于Vibe算法和GVF snake的运动目标轮廓可靠提取算法。首先通过Vibe算法快速定位运动目标的感兴趣区域,并结合数学形态学、边界快速粗定位算法,获得... 针对目标运动检测算法得到的运动目标轮廓存在轮廓不完整、不准确等问题,本文提出一种基于Vibe算法和GVF snake的运动目标轮廓可靠提取算法。首先通过Vibe算法快速定位运动目标的感兴趣区域,并结合数学形态学、边界快速粗定位算法,获得运动目标轮廓粗定位,再利用改进主动轮廓模型能够实时可靠提取运动目标的轮廓。改进的提取算法具有良好的模型初始化条件,使得本方法不仅能够得到准确的运动目标轮廓,而且满足了实时性要求。实验结果表明,该算法能够实时可靠地提取运动目标轮廓。 展开更多
关键词 轮廓提取 Vibe算法 GVF SNAKE算法 轮廓粗定位
下载PDF
姿态解算与外力加速度同步估计算法 被引量:4
10
作者 孟唐宇 浦剑涛 +1 位作者 方建军 梁岚珍 《计算机应用》 CSCD 北大核心 2016年第5期1469-1474,共6页
针对惯性导航应用中,姿态解算与外力加速度估计互相干扰的问题,提出一种基于四元数和扩展卡尔曼滤波器的姿态解算与外力加速度同步估计算法。首先,利用估计的外力加速度修正传感器加速度数据得到准确的反向重力加速度,再结合地磁场向量... 针对惯性导航应用中,姿态解算与外力加速度估计互相干扰的问题,提出一种基于四元数和扩展卡尔曼滤波器的姿态解算与外力加速度同步估计算法。首先,利用估计的外力加速度修正传感器加速度数据得到准确的反向重力加速度,再结合地磁场向量通过梯度下降算法解算得到旋转四元数的测量值;其次,构建扩展卡尔曼滤波模型,对旋转四元数和外力加速度进行更新,得到旋转四元数的预测值和外力加速度的预测值;最后,用旋转四元数的测量值和测量得到的加速度数据对预测值通过扩展卡尔曼滤波的方法进行校正,最终得到准确的旋转四元数和参考坐标系下三轴方向上的外力加速度。实验表明,通过扩展卡尔曼滤波同时对姿态和外力加速度估计的方法,能够迅速收敛并准确得机体姿态信息以及外力加速度信息,欧拉角误差为±1.95°,加速度误差为±0.12 m/s^2,并且该算法能有效抑制外力加速度对姿态解算的影响,准确估计外力加速度。 展开更多
关键词 姿态解算 四元数 扩展卡尔曼滤波 梯度下降法 外力加速度
下载PDF
基于梯度下降的自适应姿态融合算法 被引量:9
11
作者 陈卓 任久春 朱谦 《传感器与微系统》 CSCD 2019年第3期124-126,共3页
针对第一代帆船姿态测量系统中采用的自适应卡尔曼滤波算法作用范围有限、动态性能较差等缺陷,基于微机电系统(MEMS)惯性传感器与梯度下降姿态融合算法提出了两种自适应方法,分别根据当前时刻之前N个采样点的平均运动加速度与加速度的... 针对第一代帆船姿态测量系统中采用的自适应卡尔曼滤波算法作用范围有限、动态性能较差等缺陷,基于微机电系统(MEMS)惯性传感器与梯度下降姿态融合算法提出了两种自适应方法,分别根据当前时刻之前N个采样点的平均运动加速度与加速度的变化量设计自适应控制因子,得到稳定的动态梯度下降步长。实验结果表明:两种算法性能均优于自适应卡尔曼滤波与单点加速度抑制法,其中,基于加速度增量的控制算法更加符合高速运动状态下加速度剧烈变化的实际规律,测量性能达到最优,符合海面帆船运动船体姿态测量的实际需求。 展开更多
关键词 姿态解算 多传感器测量 梯度下降算法 自适应滤波融合 加速度控制
下载PDF
基于RBF神经网络的跌倒检测算法 被引量:1
12
作者 刘勃 孔韦韦 +1 位作者 肖家钦 王明伟 《计算机技术与发展》 2022年第6期167-172,178,共7页
为了利用便携式可穿戴设备精确监测老年人运动状态,及时识别老年人突发跌倒等意外行为,针对传统算法中阈值设计的经验性、随机性等不足,提出基于径向基函数(radial basis function,RBF)神经网络的跌倒检测算法。通过分析研究人体日常行... 为了利用便携式可穿戴设备精确监测老年人运动状态,及时识别老年人突发跌倒等意外行为,针对传统算法中阈值设计的经验性、随机性等不足,提出基于径向基函数(radial basis function,RBF)神经网络的跌倒检测算法。通过分析研究人体日常行为和跌倒动作的运动特征,对人体日常运动状态进行分类。运用部署在人体腰部的三轴加速度传感器采集人体运动状态数据,构建关于加速度均值、标准差、极大值与极小值幅度差和极大值与极小值时间差的组合特征向量,采用梯度下降法进行RBF神经网络训练和优化,通过RBF神经网络分类器实现对日常行为和跌倒动作的识别。实验结果表明:基于RBF神经网络的跌倒检测算法在跌倒和非跌倒的分类识别中,准确率、灵敏度和特异性均保持了较高的水平,达到了较好的分类性能。 展开更多
关键词 跌倒检测 运动特征 分类识别 加速度传感器 RBF神经网络 梯度下降法
下载PDF
基于GPU的分布式全息孔径数字成像技术研究
13
作者 黄家应 杨峰 +1 位作者 朱磊 饶长辉 《半导体光电》 CAS 北大核心 2020年第2期257-263,共7页
分布式全息孔径数字成像技术是利用数字全息记录各子孔径的复振幅信息,通过孔径间相位拼接实现综合成像的一种主动成像技术。在远距离成像中,大气湍流引入的子孔径内高阶相位误差和子孔径间低阶相位误差,以及孔径间的位置失配误差,都会... 分布式全息孔径数字成像技术是利用数字全息记录各子孔径的复振幅信息,通过孔径间相位拼接实现综合成像的一种主动成像技术。在远距离成像中,大气湍流引入的子孔径内高阶相位误差和子孔径间低阶相位误差,以及孔径间的位置失配误差,都会影响成像质量。随机并行梯度下降算法(SPGD)是一种无波前探测优化控制算法,具有可以并行、快速收敛、高效可靠等优点,可用于校正系统孔径内高阶和孔径间低价相位误差。但是SPGD算法需要多次迭代,运算量巨大,难以满足实时性要求。文章基于GPU平台,对高、低阶相位误差校正进行了并行加速处理,运算速度较CPU平台分别提升26.42倍和36.47倍。此外,采用AKZAE算法校正各子孔径间的位置失配误差,完成了各子孔径复振幅的拼接,最终实现了分布式四孔径的综合成像。 展开更多
关键词 分布式孔径 数字全息 随机并行梯度下降算法 GPU并行加速
下载PDF
传感器网络中阈值Nesterov加速梯度下降定位方法 被引量:1
14
作者 秦宁宁 陈肯 孙文心 《传感技术学报》 CAS CSCD 北大核心 2018年第7期1091-1096,共6页
在传感器网络定位问题中,利用接收信号强度RSSI(Received Signal Strength Indication)的定位方法存在着接收信号传播不稳定,定位精度较低的问题。为解决该问题,提出了一种基于阈值Nesterov加速梯度下降NAGT(Nesterov Accelerated Gradi... 在传感器网络定位问题中,利用接收信号强度RSSI(Received Signal Strength Indication)的定位方法存在着接收信号传播不稳定,定位精度较低的问题。为解决该问题,提出了一种基于阈值Nesterov加速梯度下降NAGT(Nesterov Accelerated Gradient Descent with Threshold)的RSSI定位算法。算法引入Nesterov思想,不断更新寻优动量,以达到损失函数最小,从而求取对应的未知基站坐标,通过增设阈值,降低了算法陷入局部最优的概率。经仿真比较分析,NAGT方法相对于粒子群算法与随机梯度法,在定位精度与效率上有着较为明显的优势。 展开更多
关键词 无线传感器网络 定位 RSSI Nesterov加速梯度下降法
下载PDF
基于负相关性增强的不平衡多标签学习算法 被引量:1
15
作者 程玉胜 曹天成 +1 位作者 王一宾 郑伟杰 《计算机工程与科学》 CSCD 北大核心 2021年第9期1700-1710,共11页
由于标签空间过大,标签分布不平衡问题在多标签数据集中广泛存在,解决该问题在一定程度上可以提高多标签学习的分类性能。通过标签相关性提升分类性能是解决该问题的一种最常见的有效策略,众多学者进行了大量研究,然而这些研究更多地是... 由于标签空间过大,标签分布不平衡问题在多标签数据集中广泛存在,解决该问题在一定程度上可以提高多标签学习的分类性能。通过标签相关性提升分类性能是解决该问题的一种最常见的有效策略,众多学者进行了大量研究,然而这些研究更多地是采用基于正相关性策略提升性能。在实际问题中,除了正相关性外,标签的负相关性也可能存在,如果在考虑正相关性的同时,兼顾负相关性,无疑能够进一步改善分类器的性能。基于此,提出了一种基于负相关性增强的不平衡多标签学习算法——MLNCE,旨在解决多标签不平衡问题的同时,兼顾标签间的正负相关性,从而提高多标签分类器的分类性能。首先利用标签密度信息改造标签空间;然后在密度标签空间中探究标签真实的正反相关性信息,并添加到分类器目标函数中;最后利用加速梯度下降法求解输出权重以得到预测结果。在11个多标签标准数据集上与其他6种多标签学习算法进行对比实验,结果表明MLNCE算法可以有效提高分类精度。 展开更多
关键词 多标签学习 多标签不平衡 标签正负相关性 标签密度 加速梯度下降法
下载PDF
战术导弹末端攻角收敛优化设计方法 被引量:1
16
作者 管茂桥 崔晓曦 +2 位作者 王林平 贾鑫 邹景锋 《兵器装备工程学报》 CSCD 北大核心 2021年第9期83-88,共6页
针对装有侵彻战斗部的导弹飞行末端攻角归零的需求,提出了过载收攻角自动驾驶仪和姿态收攻角自动驾驶仪两种攻角收敛方案。将导弹末端攻角收敛问题,转化为在某期望时间后攻角绝对值收敛于某小量的优化问题,待优化量为攻角收敛驾驶仪的... 针对装有侵彻战斗部的导弹飞行末端攻角归零的需求,提出了过载收攻角自动驾驶仪和姿态收攻角自动驾驶仪两种攻角收敛方案。将导弹末端攻角收敛问题,转化为在某期望时间后攻角绝对值收敛于某小量的优化问题,待优化量为攻角收敛驾驶仪的外回路控制参数,采用最速梯度下降方法对该问题进行求解。使用导弹线性化状态空间作为优化算法的数学模型,设计了2种攻角收敛自动驾驶仪的控制参数;以战术导弹的某典型动力系数为例,分别优化了过载收攻角自动驾驶仪和姿态收攻角自动驾驶仪的控制参数。使用数学仿真对参数优化设计结果的有效性进行了验证,并使用根轨迹法对两种驾驶仪进行优劣对比,结果表明姿态收攻角驾驶仪对舵机性能要求更高。 展开更多
关键词 收攻角 优化控制 根轨迹 过载驾驶仪 姿态驾驶仪 最速梯度优化
下载PDF
一种求解无约束优化问题的修正共轭梯度算法
17
作者 王晓亮 袁功林 段侠彬 《井冈山大学学报(自然科学版)》 2016年第1期15-21,共7页
提出了一种求解无约束优化问题修正的共轭梯度算法,该算法具有函数值信息,而且对线搜索技术具有加速作用,另外该算法不仅具有充分下降性还在适当条件下具有全局收敛性。数值结果也表明该算法对测试问题是有效的。
关键词 共轭梯度 函数值 加速项 充分下降
下载PDF
Research on three-step accelerated gradient algorithm in deep learning
18
作者 Yongqiang Lian Yincai Tang Shirong Zhou 《Statistical Theory and Related Fields》 2022年第1期40-57,共18页
Gradient descent(GD)algorithm is the widely used optimisation method in training machine learning and deep learning models.In this paper,based on GD,Polyak’s momentum(PM),and Nesterov accelerated gradient(NAG),we giv... Gradient descent(GD)algorithm is the widely used optimisation method in training machine learning and deep learning models.In this paper,based on GD,Polyak’s momentum(PM),and Nesterov accelerated gradient(NAG),we give the convergence of the algorithms from an ini-tial value to the optimal value of an objective function in simple quadratic form.Based on the convergence property of the quadratic function,two sister sequences of NAG’s iteration and par-allel tangent methods in neural networks,the three-step accelerated gradient(TAG)algorithm is proposed,which has three sequences other than two sister sequences.To illustrate the perfor-mance of this algorithm,we compare the proposed algorithm with the three other algorithms in quadratic function,high-dimensional quadratic functions,and nonquadratic function.Then we consider to combine the TAG algorithm to the backpropagation algorithm and the stochastic gradient descent algorithm in deep learning.For conveniently facilitate the proposed algorithms,we rewite the R package‘neuralnet’and extend it to‘supneuralnet’.All kinds of deep learning algorithms in this paper are included in‘supneuralnet’package.Finally,we show our algorithms are superior to other algorithms in four case studies. 展开更多
关键词 accelerated algorithm backpropagation deep learning learning rate MOMENTUM stochastic gradient descent
原文传递
Convergence of Gradient Algorithms for Nonconvex C^(1+α) Cost Functions
19
作者 Zixuan WANG Shanjian TANG 《Chinese Annals of Mathematics,Series B》 SCIE CSCD 2023年第3期445-464,共20页
This paper is concerned with convergence of stochastic gradient algorithms with momentum terms in the nonconvex setting.A class of stochastic momentum methods,including stochastic gradient descent,heavy ball and Neste... This paper is concerned with convergence of stochastic gradient algorithms with momentum terms in the nonconvex setting.A class of stochastic momentum methods,including stochastic gradient descent,heavy ball and Nesterov’s accelerated gradient,is analyzed in a general framework under mild assumptions.Based on the convergence result of expected gradients,the authors prove the almost sure convergence by a detailed discussion of the effects of momentum and the number of upcrossings.It is worth noting that there are not additional restrictions imposed on the objective function and stepsize.Another improvement over previous results is that the existing Lipschitz condition of the gradient is relaxed into the condition of H?lder continuity.As a byproduct,the authors apply a localization procedure to extend the results to stochastic stepsizes. 展开更多
关键词 gradient descent methods Nonconvex optimization accelerated gradient descent Heavy-ball momentum
原文传递
ACCELERATED OPTIMIZATION WITH ORTHOGONALITY CONSTRAINTS
20
作者 Jonathan W.Siegel 《Journal of Computational Mathematics》 SCIE CSCD 2021年第2期207-226,共20页
We develop a generalization of Nesterov’s accelerated gradient descent method which is designed to deal with orthogonality constraints.To demonstrate the effectiveness of our method,we perform numerical experiments w... We develop a generalization of Nesterov’s accelerated gradient descent method which is designed to deal with orthogonality constraints.To demonstrate the effectiveness of our method,we perform numerical experiments which demonstrate that the number of iterations scales with the square root of the condition number,and also compare with existing state-of-the-art quasi-Newton methods on the Stiefel manifold.Our experiments show that our method outperforms existing state-of-the-art quasi-Newton methods on some large,ill-conditioned problems. 展开更多
关键词 Riemannian optimization Stiefel manifold accelerated gradient descent Eigenvector problems Electronic structure calculations
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部