期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
非平稳MDP—平均样本轨道最优
1
作者 郭先平 《数学物理学报(A辑)》 CSCD 北大核心 2000年第1期31-35,共5页
作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要... 作者考虑的是任意状态空间,任意行动空间非平稳MDP的平均样本轨道目标.在弱遍历条件下,用鞅的极限理论,证明了最优马氏策略的存在性,推广了A.Arapostathis,V.Borkar,E.F.Gaucherand,M.Ghosh,S.Marcus[1](1993)的主要结果. 展开更多
关键词 马氏决策规划 平均样本轨道目标 非平衡 MDP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部