无界报酬向量值折扣马氏决策规划被引量：2

A Discounted Vector-Valued Markovian Decision Programming with Unbounded Rewards

导出

摘要本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。 In this paper, a discounted vector-valued Markovian decision model with unbounded rewards is investigated.The optimization,here,is made according to a partial-order Criterion determined by linearly independent vectors-generated convex cone.The existence of an optimal policy is proved .The problems of the intrinsic structures of some optimal policies are discussed. Necessary and sufficient conditions for the existence of strongly optimal policy is given. It is also shown that the convex combination policy and the self-combination policy of some optimal policies are optimal ,and that stationary policies possess a predominance in general policies

作者张升张继红

机构地区云南大学

出处《云南大学学报（自然科学版）》 CAS CSCD 1993年第3期200-207,共8页 Journal of Yunnan University(Natural Sciences Edition)

关键词无界报酬向量马氏决策规划 Discounted Markovian Decision Programming, optimal policies, Unbounded vector-valued Reward

分类号 O211.62 [理学—概率论与数理统计]

引文网络
相关文献

参考文献3

1刘克,刘建庸.向量值半Markov决策规划[J].科学通报,1990,35(18):1364-1367. 被引量：5
2董泽清,刘克.折扣模型最优策略的结构[J]数学研究与评论,1986(03).
3郭世贞.折扣目标马氏决策的最优策略问题[J]经济数学,1984(00).

二级参考文献1

1Dong Zeging，Sci Chin A，1986年，29卷，337页

共引文献4

1曾庆宁.向量值半Markov决策规划的线性加权解法[J].应用数学,2001,14(S1):77-80.
2贾让成.向量值有限平均MDP[J].西北师范大学学报（自然科学版）,1994,30(3):16-19.
3章芸,郭世贞.具无界递归向量值报酬函数的非时齐马尔科夫决策规划[J].昆明工学院学报,1995,20(2):42-48.
4曾庆宁.向量值马氏决策规划的线性加权解法[J].应用数学学报,2001,24(4):630-632.

同被引文献1

1秦叔明.R^P中有界凸集的几个性质[J].云南工业大学学报,1995,11(1):81-85. 被引量：4

引证文献2

1张升,张继红.无界报酬向量值折扣马氏决策规划──最优平稳策略及算法[J].云南大学学报（自然科学版）,1994,16(4):299-305.
2秦叔明.时齐向量值马氏决策模型[J].数理统计与应用概率,1998,13(4):20-26.

1张升,张继红.无界报酬向量值折扣马氏决策规划──最优平稳策略及算法[J].云南大学学报（自然科学版）,1994,16(4):299-305.
2胡奇英.非时齐无界报酬马氏决策规划[J].西安电子科技大学学报,1992,19(1):72-83.
3胡奇英.无界报酬折扣马氏决策规划中的逐次逼近法[J].数理统计与应用概率,1995,10(2):31-37.
4伍从斌.无界报酬折扣半马氏决策模型矩最优策略的结构[J].云南大学学报（自然科学版）,1990,12(4):299-306. 被引量：1
5伍从斌.无界报酬折扣半马氏决策模型矩最优策略的存在性[J].云南大学学报（自然科学版）,1991,13(3):199-206.
6胡奇英.状态部分可观察的无界报酬马氏决策规划[J].数理统计与应用概率,1998,13(3):79-86. 被引量：3
7邱德华.无界报酬非时齐折扣马氏决策模型[J].衡阳师专学报,1997,18(6):16-22.
8胡奇英.报酬无界的平均准则马氏决策过程(英文)[J].运筹学学报,2002,6(1):1-8.
9张昇,郭世贞.无界报酬非时齐折扣马氏决策模型[J].应用数学学报,1990,13(3):314-323. 被引量：2
10伍从斌,张继红.报酬无界的连续时间折扣马氏决策规划[J].应用概率统计,1997,13(1):1-10. 被引量：2

云南大学学报（自然科学版）

1993年第3期

浏览历史

内容加载中请稍等...

无界报酬向量值折扣马氏决策规划被引量：2

参考文献3

二级参考文献1

共引文献4

同被引文献1

引证文献2

相关作者

相关机构

相关主题

浏览历史

无界报酬向量值折扣马氏决策规划 被引量：2

参考文献3

二级参考文献1

共引文献4

同被引文献1

引证文献2

相关作者

相关机构

相关主题

浏览历史

无界报酬向量值折扣马氏决策规划被引量：2