期刊文献+

基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程 被引量:2

The Finite Stage of Expected Totall Reward Model and Optimality Equation of Markov in Decision-making Vector Processes
下载PDF
导出
摘要 在马氏决策向量过程模型的理论基础上,结合决策向量和相合度等新定义,进一步提出有限阶段期望总报酬准则和最优方程,并证明最优方程的解的存在性. By applying Markov decision - making vector processes theory and the new definition of decision - making vector, consistency degree, ETC. This paper will study the finite stage of expected totall reward model and optimality equation in Markov decision - making vector processes. Finally we proved the existence of solutions in the optimality equation.
出处 《数学理论与应用》 2011年第4期7-13,共7页 Mathematical Theory and Applications
基金 琼州学院青年基金资助项目 编号QYQN201126
关键词 马氏决策向量过程模型 报酬准则 最优方程 存在性 Markov decision - making vector processes Expected totall reward model Optimality equation Existence
  • 相关文献

参考文献4

二级参考文献4

  • 1Shapley L.Stochastic games[J].Proc Nat Acad Sci,1953(3):1095-1100.
  • 2Howard R.Dynamic programming and Markov decision processes[M].Cambrige:MIT Press,1960:66-103.
  • 3胡奇英,刘建庸.马氏决策过程引论[M].西安:西安电子科技大学,2000:1-2.
  • 4胡奇英.一般化马氏决策规划的现状与展望[J].运筹学杂志,1992,11(2):21-29. 被引量:7

共引文献8

同被引文献4

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部