期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
MDP平均模型强最优问题
1
作者 邱德华 《衡阳师范学院学报》 1993年第3期1-11,共11页
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了... 对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。 展开更多
关键词 马尔科夫决策 非时齐平均模型MDP弱最优策略 准强最优策略 强最策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部