期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于优化强化学习的多智能体编队最优控制
被引量:
1
1
作者
张海峰
简燕红
+1 位作者
王宏刚
崔琪
《控制工程》
CSCD
北大核心
2022年第12期2316-2321,共6页
针对一类非线性多智能体系统的编队控制问题,设计了基于优化强化学习的最优控制策略。首先,通过设计分布式多智能体性能指标函数获得了多智能体的分布式哈密顿-雅可比-贝尔曼(HJB)方程。利用优化强化学习的方法来求解HJB方程,从而获得...
针对一类非线性多智能体系统的编队控制问题,设计了基于优化强化学习的最优控制策略。首先,通过设计分布式多智能体性能指标函数获得了多智能体的分布式哈密顿-雅可比-贝尔曼(HJB)方程。利用优化强化学习的方法来求解HJB方程,从而获得最优控制策略,其中评价网络和执行网络分别用于逼近系统的性能指标函数和最优控制策略。与传统强化学习方法相比,所提方法避免了通过基于HJB方程估计误差平方的梯度下降法来获得神经网络的权重更新律的过程,从而简化了控制器设计。然后,通过李雅普诺夫理论证明了闭环控制系统的稳定性。最后,通过仿真实验验证了所提控制方法的有效性。
展开更多
关键词
多智能体
最优编队控制
强化学习
神经网络
下载PDF
职称材料
题名
基于优化强化学习的多智能体编队最优控制
被引量:
1
1
作者
张海峰
简燕红
王宏刚
崔琪
机构
国家电网有限公司大数据中心
出处
《控制工程》
CSCD
北大核心
2022年第12期2316-2321,共6页
文摘
针对一类非线性多智能体系统的编队控制问题,设计了基于优化强化学习的最优控制策略。首先,通过设计分布式多智能体性能指标函数获得了多智能体的分布式哈密顿-雅可比-贝尔曼(HJB)方程。利用优化强化学习的方法来求解HJB方程,从而获得最优控制策略,其中评价网络和执行网络分别用于逼近系统的性能指标函数和最优控制策略。与传统强化学习方法相比,所提方法避免了通过基于HJB方程估计误差平方的梯度下降法来获得神经网络的权重更新律的过程,从而简化了控制器设计。然后,通过李雅普诺夫理论证明了闭环控制系统的稳定性。最后,通过仿真实验验证了所提控制方法的有效性。
关键词
多智能体
最优编队控制
强化学习
神经网络
Keywords
Multi-agent
optimal formation control
reinforcement learning
neural network
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于优化强化学习的多智能体编队最优控制
张海峰
简燕红
王宏刚
崔琪
《控制工程》
CSCD
北大核心
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部