期刊文献+

非平稳MDP平均模型—状态空间可数情形

NO-STATIONARY MDP MODEL WITH THE AVERAGE CRITERION—THE DENUMERABLE STATE SPACE CASE
下载PDF
导出
摘要 本文利用扩充的不动点定理,建立了相应于非平稳MDP平均模型的最优方程,据此给出了最优策略和ε-最优策略存在的充分条件.许多有关平稳MDP平均模型的结果,尤其是Ross(1983)的结果,均可由本文给出. In this paper,using the generalization of the fixed point theorem for cont-ractions,we set up the optimal equation for non-stationary MDP with the aver-age criterion and supply the sufficent conditions under which either the optimalor ε-optimal polices exists.Many results for stationary MDP model with theaverage criterion,especially the results obtained by Ross(1983),can be taken asthe typical example of this paper.
作者 郭先平
出处 《湖南师范大学自然科学学报》 CAS 1991年第4期302-308,324,共8页 Journal of Natural Science of Hunan Normal University
关键词 马氏决策规划 非平稳 平均目标 MDP model no-stationary average criterion
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部