期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望
被引量:
21
1
作者
徐昕
沈栋
+1 位作者
高岩青
王凯
《自动化学报》
EI
CSCD
北大核心
2012年第5期673-687,共15页
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于...
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。
展开更多
关键词
学习控制
MARKOV决策过程
增强学习
近似动态规划
机器学习
自适应控制
下载PDF
职称材料
题名
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望
被引量:
21
1
作者
徐昕
沈栋
高岩青
王凯
机构
国防科学技术大学机电工程与自动化学院自动化研究所
中国科学院自动化研究所
复杂系统智能管理与控制国家重点实验室
美国亚利桑那大学系统与工业工程学院
国防科学技术大学军事计算实验与平行系统技术研究中心
出处
《自动化学报》
EI
CSCD
北大核心
2012年第5期673-687,共15页
基金
国家自然科学基金(61075072
90820302
+2 种基金
60921061)
霍英东青年教师基金优选资助课题(114005)
教育部新世纪优秀人才支持计划(NCET-10-0901)资助~~
文摘
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。
关键词
学习控制
MARKOV决策过程
增强学习
近似动态规划
机器学习
自适应控制
Keywords
doi 10.3724/sp.j.1004.2012.00673
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TP13 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望
徐昕
沈栋
高岩青
王凯
《自动化学报》
EI
CSCD
北大核心
2012
21
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部