期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
半马氏MDP平均模型
1
作者 邱德华 《衡阳师专学报》 1998年第3期1-7,共7页
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。
关键词 最优方程 最优平稳策略 半马氏MDP模型
下载PDF
非时齐折扣马氏决策规划(一) 被引量:1
2
作者 张升 郭世贞 《云南大学学报(自然科学版)》 CAS CSCD 1990年第4期285-292,共8页
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件.
关键词 马氏决策规划 动态规划 最优策略
原文传递
连续时间马尔可夫决策过程的折扣模型
3
作者 郭先平 戴永隆 《数学学报(中文版)》 SCIE CSCD 北大核心 2002年第1期171-182,共12页
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, ... 本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, 费用率函数可能无界, 且允许行动空间非空任意的情形. 本文首次用"α-折扣费用最优不等式"更新了传统的α-折扣费用最优方程,并用"最优不等式"和新的方法,不仅证明了传统的主要结果即最优平稳策略的存在性, 而且还进一步探讨了( ∈>0  )-最优平稳策略,具有单调性质的最优平稳策略, 以及(∈≥0) -最优决策过程的存在性, 得到了一些有意义的新结果. 最后, 提供了一个迁移率受控的生灭系统例子, 它满足本文的所有条件, 而传统的假设(见文献[1-14])均不成立. 展开更多
关键词 Q-过程 无界费用 单调最优策略 连续时间马尔可夫决策过程 折扣模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部