-
题名非时齐平均模型最优策略的存在性
- 1
-
-
作者
段国圣
狄其中
-
机构
江汉石油学院基础课部
-
出处
《江汉石油学院学报》
CSCD
北大核心
1991年第4期90-93,共4页
-
文摘
1 模型讨论平均模型的文章不少,但都限于时齐的情形。本文讨论的非时齐平均模型。
-
关键词
非时齐平均模型
最优策略
存在性
-
分类号
O212
[理学—概率论与数理统计]
-
-
题名MDP平均模型强最优问题
- 2
-
-
作者
邱德华
-
出处
《衡阳师范学院学报》
1993年第3期1-11,共11页
-
文摘
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。
-
关键词
马尔科夫决策
非时齐平均模型MDP弱最优策略
准强最优策略
强最优策略
-
Keywords
Markov decision
non-stationary average reward MDP
weak optimal policy quasistrong optimal policy
strong optimal policy
-
分类号
G658.3
[文化科学—教育学]
-