期刊文献+

用生成函数判定MDP的矩最优策略

Use the Generating Function to Determinate the Moments—Optimality for the MDP
下载PDF
导出
摘要 本文引入了策略的生成函数,利用此函数来判定一个策略是否是矩最优策略。证明了π是矩最优策略的充分必要条件是它的生成函数M(π,x)等于M~*(x),特别是得出了π是矩最优策略的充分条件是M(π,x)等于(?)~*(x)。后一结论对于判定矩最优策略有较大的实用价值。 In this paper we establish a generating function of a policy to determinate the oments—optimality of a policy. We have proved that a policy is of moments—optimality if only f its generating function M(π, x) is equal to the funtion M~*(x)and that a policy is of oments—optimality when its generating function M(π, x) is equal to the function (?)~*(x). In special he later result is more useful to determinate the moments—optimality of a policy.
作者 易雁青
机构地区 湖南师范大学
出处 《经济数学》 1989年第5期52-59,共8页 Journal of Quantitative Economics
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部