期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
机器更新决策规划中的强最优问题
1
作者 许永龙 《天津师大学报(自然科学版)》 1994年第4期14-19,共6页
在本文中,主要研究马尔科夫决策规划机器更新过程的平均目标“弱最优”“准强最优”“强最优”问题。文中把按数学期望意义下“平均”,总报酬的最优问题称为“弱最优”.同时,定义了“准强最优”“强最优”等标准。在以上三个最优的... 在本文中,主要研究马尔科夫决策规划机器更新过程的平均目标“弱最优”“准强最优”“强最优”问题。文中把按数学期望意义下“平均”,总报酬的最优问题称为“弱最优”.同时,定义了“准强最优”“强最优”等标准。在以上三个最优的标准下,对于非齐次马尔科夫决策规划机器更新问题,提出并解决了“弱最优”,“准强最优”,“强最优”在全体马氏策略类Πm上相互等价。 展开更多
关键词 机器更新过程 强最优策略 马尔科夫过程
下载PDF
MDP平均模型强最优问题
2
作者 邱德华 《衡阳师范学院学报》 1993年第3期1-11,共11页
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了... 对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。 展开更多
关键词 马尔科夫决策 非时齐平均模型MDP弱最优策略 强最优策略 强最优策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部