期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
非平稳MDP—平均样本轨道最优
1
作者
郭先平
《数学物理学报(A辑)》
CSCD
北大核心
2000年第1期31-35,共5页
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要...
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要结果.
展开更多
关键词
马氏决策规划
平均样本轨道目标
非平衡
MDP
下载PDF
职称材料
题名
非平稳MDP—平均样本轨道最优
1
作者
郭先平
机构
中山大学数学系
出处
《数学物理学报(A辑)》
CSCD
北大核心
2000年第1期31-35,共5页
基金
国家青年基金
广东省自然科学基金
文摘
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要结果.
关键词
马氏决策规划
平均样本轨道目标
非平衡
MDP
Keywords
Markov decision programming (MDP), Average sample path criterion, Nonstationary, Optimal Markov policies
分类号
O221.5 [理学—运筹学与控制论]
O211.62 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
非平稳MDP—平均样本轨道最优
郭先平
《数学物理学报(A辑)》
CSCD
北大核心
2000
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部