具无界递归向量值报酬函数的非时齐马尔科夫决策规划

OnTime Non-Homogeneous Markovian Decision Programlning With Recursive Vector-reward Functions

下载PDF

导出

摘要研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划，给出了模型的向量最优方程，首次给出了模型的向量ε─最优策略的定义及其存在的充分条件，讨论了该模型的有效策略和最优策略。 The time non-homogeneous Markovian decision rnodel with unbounded recursive vector·rewardis discussed. The vectoroptimality eguations for the model are established,The definition of vector ε-op-timal policy is given for the first time. The sufficient conditions for existence of vector ε-optirnal is given,Efficient Policies and optimal policies of this model are also discussed.

作者章芸郭世贞

机构地区昆明工学院基础部

出处《昆明工学院学报》 1995年第2期42-48,共7页

关键词向量值报酬函数递归报酬函数马氏决策规划 Markovian Decision,recursive vector reward fanctions vector ε-optinol police efficient Policy:optimal policy

分类号 O221 [理学—运筹学与控制论]

引文网络
相关文献

参考文献2

1章芸,郭世贞.具无界递归报酬函数的非时齐马尔科夫决策规划[J].昆明工学院学报,1993,18(2):73-81. 被引量：1
2刘克,刘建庸.向量值半Markov决策规划[J].科学通报,1990,35(18):1364-1367. 被引量：5

二级参考文献2

1Dong Zeging，Sci Chin A，1986年，29卷，337页
2Jianyong Liu,Ke Liu. On Markovian decision programming with recursive reward functions[J] 1990,Annals of Operations Research(1):145～164

共引文献4

1曾庆宁.向量值半Markov决策规划的线性加权解法[J].应用数学,2001,14(S1):77-80.
2张升,张继红.无界报酬向量值折扣马氏决策规划[J].云南大学学报（自然科学版）,1993,15(3):200-207. 被引量：2
3贾让成.向量值有限平均MDP[J].西北师范大学学报（自然科学版）,1994,30(3):16-19.
4曾庆宁.向量值马氏决策规划的线性加权解法[J].应用数学学报,2001,24(4):630-632.

1章芸,郭世贞.具无界递归报酬函数的非时齐马尔科夫决策规划[J].昆明工学院学报,1993,18(2):73-81. 被引量：1
2唐恒永.随机排序模型及求解方法[J].数学理论与应用,1999,19(3):22-26. 被引量：6
3杨春巍.马尔科夫排队过程[J].重庆建筑大学学报,1998,20(2):102-108.
4赵强,周林,陈维,齐立辉.现代战争条件下地导装备备件库存数量优化分析[J].兵工自动化,2009,28(2):54-56. 被引量：1

昆明工学院学报

1995年第2期

浏览历史

内容加载中请稍等...

具无界递归向量值报酬函数的非时齐马尔科夫决策规划

参考文献2

二级参考文献2

共引文献4

相关作者

相关机构

相关主题

浏览历史