期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Borel状态空间非平稳MDP的平均方差准则
1
作者 郭先平 《数学学报(中文版)》 SCIE CSCD 北大核心 2001年第2期333-342,共10页
本文考虑具有 Borel状态空间和行动空间非平稳 MDP的平均方差准则.首先,在遍历条件下,利用最优方程,证明了关于平均期望目标最优马氏策略的存在性.然后,通过构造新的模型,利用马氏过程的理论,进一步证明了在关于平均期... 本文考虑具有 Borel状态空间和行动空间非平稳 MDP的平均方差准则.首先,在遍历条件下,利用最优方程,证明了关于平均期望目标最优马氏策略的存在性.然后,通过构造新的模型,利用马氏过程的理论,进一步证明了在关于平均期望目标是最优的一类马氏策略中,存在一个马氏策略使得平均方差达到最小.作为本文的特例还得到了 Dynkin E. B.和 Yushkevich A. A.及 Kurano M.等中的主要结果. 展开更多
关键词 非平衡MDP 平均方差目标 最优方程 最优马氏策略 Borel状态空间 遍历条件 马氏过程
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部