期刊文献+

基于未来阈值的马尔可夫策略的最优化算法

Algorithm of Markov optimum policy based on future threshold value
下载PDF
导出
摘要 在一种新的准则概率阈值准则下讨论马尔可夫决策的最优解的算法问题.在该准则下,采用基于未来阈值的方法,求解马尔可夫最优策略. The arithmetic problem of Markov optimum solution under a new principle named probability threshold value principle is discussed.With this principle,the Markov optimum policy is solved based on the future threshold value.
作者 姜峰 回钰
出处 《吉林化工学院学报》 CAS 2004年第2期97-99,共3页 Journal of Jilin Institute of Chemical Technology
关键词 MARKOV决策过程 Markov最优策略 概率阈值准则 markov decision processes markov optimum policy probability threshold value
  • 相关文献

参考文献5

  • 1Shapley,L.S.Stochastic games[M].Proceedings of the National Academy of Sciences,1953:1095-1100.
  • 2Howard,R.A,.Dynamic Programming and Markov Processes[M],MII Press,Cambridge.1960.
  • 3Blackwell,D.Discrete dynamic programming[J].Ann Math Stat,1962.33:719-726.
  • 4Derman.C,.On Sequential decisions and Markov chains[J].Man.Sci.1962.9:719-726.
  • 5Dynkin,E.B.and Yushkevich,A.A..Controlled Markov Processes[M].Springer-Verlag,New York,1979.

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部