期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
受控排队系统的平均最优与约束平均最优 被引量:1
1
作者 张兰兰 郭先平 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第2期139-144,共6页
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与... 根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略. 展开更多
关键词 连续时间马尔可夫决策过程 平均准则 受控排队系统 平均最优平稳策略 约束平均最优策略
下载PDF
受约束的非平稳期望总报酬模型
2
作者 郭先平 《数理统计与应用概率》 1996年第4期326-331,共6页
本文考虑的是状态空间和行动空间均为一般集的受约束的平稳期望总报酬模型首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约... 本文考虑的是状态空间和行动空间均为一般集的受约束的平稳期望总报酬模型首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约束最优策略的存在性从而既推广了无约束的ErikjBalder[10](1992)的模型。 展开更多
关键词 约束最优策略 期望总报酬 马氏决策规划
下载PDF
约束折扣半马氏决策规划 被引量:2
3
作者 胡光华 张升 《应用数学学报》 CSCD 北大核心 1997年第2期187-195,共9页
本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-... 本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-约束最优策略最后构造出一线性规划,证明了该线性规划的最优解与p-约束最优随机平稳策略之间存在——对应关系. 展开更多
关键词 半马氏决策规划 约束最优策略 线性规划 CDSMDP
原文传递
具有多个向量约束的折扣马氏决策规划 被引量:1
4
作者 刘建庸 黄思明 胡光华 《科学通报》 EI CAS CSCD 北大核心 1995年第16期1448-1451,共4页
文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条... 文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条件下,该文证明了存在混合平稳策略是约束最优策略,并给出了算法.文献[2]给出了在马氏策略类及平稳策略类中求约束最优策略的算法. 展开更多
关键词 马氏决策规划 向量约束 约束最优策略
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部