期刊文献+

折扣MDP非ε-最优策略的检验准则

下载PDF
导出
摘要 本文讨论了可数状态空间、可数决策空间、次随机转移率族、有界报酬函数的马氏决策规划(MDP)的折扣模型,给出了一个非ε-最优策略的检验准则.
作者 李成福
机构地区 湘潭大学数学系
出处 《数学理论与应用》 1999年第4期135-136,共2页 Mathematical Theory and Applications
  • 相关文献

参考文献1

  • 1董泽清.马氏决策规划的加速逼近算法与最小方差问题[J]数学学报,1978(02).

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部