基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程被引量：2

The Finite Stage of Expected Totall Reward Model and Optimality Equation of Markov in Decision-making Vector Processes

下载PDF

导出

摘要在马氏决策向量过程模型的理论基础上,结合决策向量和相合度等新定义,进一步提出有限阶段期望总报酬准则和最优方程,并证明最优方程的解的存在性. By applying Markov decision - making vector processes theory and the new definition of decision - making vector, consistency degree, ETC. This paper will study the finite stage of expected totall reward model and optimality equation in Markov decision - making vector processes. Finally we proved the existence of solutions in the optimality equation.

作者陈杰刘再明邢灵博

机构地区琼州学院理工学院中南大学数学科学与计算技术学院

出处《数学理论与应用》 2011年第4期7-13,共7页 Mathematical Theory and Applications

基金琼州学院青年基金资助项目编号QYQN201126

关键词马氏决策向量过程模型报酬准则最优方程存在性 Markov decision - making vector processes Expected totall reward model Optimality equation Existence

分类号 O211.62 [理学—概率论与数理统计]

引文网络
相关文献

参考文献4

1Ballman R and Salle J P La. On non -zero sum games and stochastic process [ M ]. RM -212, RAND Corp, Santa Monica, CA, 1949:26 - 46.
2Howard R. Dynamic programming and Markov decision processes [ M ]. Cambrige, MS: MIT Press, 1960:66 - 103.
3胡奇英.一般化马氏决策规划的现状与展望[J].运筹学杂志,1992,11(2):21-29. 被引量：7
4陈杰,朱全新,邢灵博.马氏决策向量过程模型初步研究[J].河南师范大学学报（自然科学版）,2010,38(5):38-40. 被引量：4

二级参考文献4

1Shapley L.Stochastic games[J].Proc Nat Acad Sci,1953(3):1095-1100.
2Howard R.Dynamic programming and Markov decision processes[M].Cambrige:MIT Press,1960:66-103.
3胡奇英,刘建庸.马氏决策过程引论[M].西安:西安电子科技大学,2000:1-2.
4胡奇英.一般化马氏决策规划的现状与展望[J].运筹学杂志,1992,11(2):21-29. 被引量：7

共引文献8

1曾庆宁.灰色马氏决策规划[J].桂林电子工业学院学报,1994,14(2):99-102.
2曾庆宁.具有模糊报酬的马氏决策规划[J].系统工程,1995,13(2):53-55.
3陈杰,朱全新,邢灵博.马氏决策向量过程模型初步研究[J].河南师范大学学报（自然科学版）,2010,38(5):38-40. 被引量：4
4陈杰,邢灵博.马氏决策向量过程模型的性质及其优越性定理[J].数学理论与应用,2013,33(1):94-99.
5陈杰,邢灵博,张宗杰.多元马氏决策向量过程模型及其参数估计[J].中国科教创新导刊,2013(19):74-74. 被引量：1
6邢灵博.高阶多元马氏决策向量过程模型的定义[J].中国科教创新导刊,2014(11):96-96.
7曾庆宁.具有模糊报酬的多目标马尔可夫决策规划[J].模糊系统与数学,2001,15(3):82-85.
8曾庆宁.向量值马氏决策规划的线性加权解法[J].应用数学学报,2001,24(4):630-632.

同被引文献4

1Ballman R and SaUe J P La. On non - zero sum games and stochastic process [ M J. RM - 212, RAND Corp, Santa Monica, CA, 1949:26 - 46.
2Howard R. Dynamic programming and Markov decision processes [ M ]. Cambrige, MS:MIT Press, 1960:66 - 103.
3陈杰,朱全新,邢灵博.马氏决策向量过程模型初步研究[J].河南师范大学学报（自然科学版）,2010,38(5):38-40. 被引量：4
4胡奇英.一般化马氏决策规划的现状与展望[J].运筹学杂志,1992,11(2):21-29. 被引量：7

引证文献2

1陈杰,邢灵博.马氏决策向量过程模型的性质及其优越性定理[J].数学理论与应用,2013,33(1):94-99.
2陈杰,邢灵博,张宗杰.多元马氏决策向量过程模型及其参数估计[J].中国科教创新导刊,2013(19):74-74. 被引量：1

二级引证文献1

1邢灵博.高阶多元马氏决策向量过程模型的定义[J].中国科教创新导刊,2014(11):96-96.

1陈杰,邢灵博.马氏决策向量过程模型的性质及其优越性定理[J].数学理论与应用,2013,33(1):94-99.
2邢灵博.高阶多元马氏决策向量过程模型的定义[J].中国科教创新导刊,2014(11):96-96.
3陈杰,邢灵博,张宗杰.多元马氏决策向量过程模型及其参数估计[J].中国科教创新导刊,2013(19):74-74. 被引量：1
4陈杰,朱全新,邢灵博.马氏决策向量过程模型初步研究[J].河南师范大学学报（自然科学版）,2010,38(5):38-40. 被引量：4
5侯振挺,郭先平.非齐次马氏决策过程的齐次化[J].数学物理学报（A辑）,1997,17(4):432-438.
6张继红,郭世贞.有限阶段非马氏决策规划的ε最优策略及算法[J].昆明理工大学学报（理工版）,1998,23(2):100-106. 被引量：2
7郭先平,黄永辉.半Markov决策过程的研究进展[J].中国科学：数学,2015,45(5):477-496.
8王广雄,林愈银,谢冰.控制问题中的线性矩阵不等式及其求解[J].电机与控制学报,1998,2(4):191-193. 被引量：9
9吴有富.基于属性的时序多层次交叉因子综合评判模型及分析法[J].系统工程理论与实践,2001,21(10):97-100. 被引量：1
10刘建庸,刘克.关于有限阶段部分可观察DP的注记[J].应用概率统计,1993,9(3):278-282.

数学理论与应用

2011年第4期

浏览历史

内容加载中请稍等...

基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程被引量：2

参考文献4

二级参考文献4

共引文献8

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程 被引量：2

参考文献4

二级参考文献4

共引文献8

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程被引量：2