期刊文献+

具无界递归向量值报酬函数的非时齐马尔科夫决策规划

OnTime Non-Homogeneous Markovian Decision Programlning With Recursive Vector-reward Functions
下载PDF
导出
摘要 研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。 The time non-homogeneous Markovian decision rnodel with unbounded recursive vector·rewardis discussed. The vectoroptimality eguations for the model are established,The definition of vector ε-op-timal policy is given for the first time. The sufficient conditions for existence of vector ε-optirnal is given,Efficient Policies and optimal policies of this model are also discussed.
作者 章芸 郭世贞
出处 《昆明工学院学报》 1995年第2期42-48,共7页
关键词 向量值报酬函数 递归报酬函数 马氏决策规划 Markovian Decision,recursive vector reward fanctions vector ε-optinol police efficient Policy:optimal policy
  • 相关文献

参考文献2

二级参考文献2

  • 1Dong Zeging,Sci Chin A,1986年,29卷,337页
  • 2Jianyong Liu,Ke Liu. On Markovian decision programming with recursive reward functions[J] 1990,Annals of Operations Research(1):145~164

共引文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部