期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习的部分线性离散时间系统的最优输出调节
被引量:
4
1
作者
庞文砚
范家璐
+1 位作者
姜艺
lewis frank leroy
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第9期2242-2253,共12页
针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态规划问题,第一个问题可以解出...
针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态规划问题,第一个问题可以解出调节器方程的解.第二个问题可以确定出控制器的最优反馈增益.然后,运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性.针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题,提出了一种数据驱动离线策略更新算法,该算法仅使用在线数据找到动态规划问题的解.然后,基于动态规划问题的解,利用在线数据为静态优化问题提供了最优解.最后,仿真结果验证了该方法的有效性.
展开更多
关键词
输出调节
离散时间系统
强化学习
非线性未知动态
下载PDF
职称材料
题名
基于强化学习的部分线性离散时间系统的最优输出调节
被引量:
4
1
作者
庞文砚
范家璐
姜艺
lewis frank leroy
机构
东北大学流程工业综合自动化国家重点实验室
德克萨斯大学阿灵顿分校
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第9期2242-2253,共12页
基金
国家自然科学基金(61533015,61991404,61991403)
辽宁省兴辽英才计划(XLYC2007135)资助。
文摘
针对同时具有线性外部干扰与非线性不确定性下的离散时间部分线性系统的最优输出调节问题,提出了仅利用在线数据的基于强化学习的数据驱动控制方法.首先,该问题可拆分为一个受约束的静态优化问题和一个动态规划问题,第一个问题可以解出调节器方程的解.第二个问题可以确定出控制器的最优反馈增益.然后,运用小增益定理证明了存在非线性不确定性离散时间部分线性系统的最优输出调节问题的稳定性.针对传统的控制方法需要准确的系统模型参数用来解决这两个优化问题,提出了一种数据驱动离线策略更新算法,该算法仅使用在线数据找到动态规划问题的解.然后,基于动态规划问题的解,利用在线数据为静态优化问题提供了最优解.最后,仿真结果验证了该方法的有效性.
关键词
输出调节
离散时间系统
强化学习
非线性未知动态
Keywords
Output regulation
discrete-time system
reinforcement learning
nonlinear unknown dynamics
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于强化学习的部分线性离散时间系统的最优输出调节
庞文砚
范家璐
姜艺
lewis frank leroy
《自动化学报》
EI
CAS
CSCD
北大核心
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部