期刊文献+

在概率阈值准则下马尔可夫策略的最优化算法 被引量:2

Optimum algorithm of Markov optimum policy under probability threshold rule
下载PDF
导出
摘要 在一种新的概率阈值准则下讨论马尔可夫决策的最优解的算法问题.采用基于增益的过去累积值的方法,求解马尔可夫最优策略. The arithmetic problems of the Markov optimum solution are discussed under the new principle. The markov optimum policy is gained bared on the previous accumulation value.
作者 姜峰 郑兆青
出处 《山东理工大学学报(自然科学版)》 CAS 2004年第1期62-65,共4页 Journal of Shandong University of Technology:Natural Science Edition
关键词 概率阈值准则 马尔可夫策略 最优化算法 MARKOV决策过程 Markov最优策略 Markov decision processes Markov optimum policy probability threshold rule
  • 相关文献

参考文献4

  • 1Howard R A. Dynamic Programming and Markov Processes[M]. Cambridge: MII Press, 1960.
  • 2Blackwell D. Discrete dynamic programming[J]. Ann Math Stat, 1962,33:719-726.
  • 3Derman C. On Sequential decisions and Markov chains[J]. Man. Sci. 1962,9:719-726.
  • 4Dynkin E B, Yushkevich A A. Controlled Markov Processes[M]. New York: Springer-Verla, 1979.

同被引文献14

引证文献2

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部