期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于状态软集结的相对值迭代算法(英文)
1
作者
胡光华
吴沧浦
乔治.瑟彬珂
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000年第3期415-418,共4页
在大规模随机控制问题中 ,值函数逼近是一种克服维数灾的方法 .考虑平均模型马氏决策规划 (MDP)的状态软集结相对值迭代算法 ,在Span压缩的条件下 ,证明了该算法的收敛性 ,同时还给出了其误差估计 .
关键词
随机控制
状态软集结
相对值
迭代算法
下载PDF
职称材料
题名
基于状态软集结的相对值迭代算法(英文)
1
作者
胡光华
吴沧浦
乔治.瑟彬珂
机构
北京理工大学自动控制系
达特茅斯学院工学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000年第3期415-418,共4页
基金
Foundationitem :supportedbytheNationalNaturalScienceFoundationofChina (696740 0 5) .
文摘
在大规模随机控制问题中 ,值函数逼近是一种克服维数灾的方法 .考虑平均模型马氏决策规划 (MDP)的状态软集结相对值迭代算法 ,在Span压缩的条件下 ,证明了该算法的收敛性 ,同时还给出了其误差估计 .
关键词
随机控制
状态软集结
相对值
迭代算法
Keywords
dynamic programming
Markov decision processes
compact representation
state aggregation
average reward
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于状态软集结的相对值迭代算法(英文)
胡光华
吴沧浦
乔治.瑟彬珂
《控制理论与应用》
EI
CAS
CSCD
北大核心
2000
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部