期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
非时齐平均模型最优策略的存在性
1
作者 段国圣 狄其中 《江汉石油学院学报》 CSCD 北大核心 1991年第4期90-93,共4页
1 模型讨论平均模型的文章不少,但都限于时齐的情形。本文讨论的非时齐平均模型。
关键词 非时齐平均模型 最优策略 存在性
下载PDF
MDP平均模型强最优问题
2
作者 邱德华 《衡阳师范学院学报》 1993年第3期1-11,共11页
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了... 对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。 展开更多
关键词 马尔科夫决策 非时齐平均模型MDP弱最优策略 准强最优策略 强最优策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部