摘要
本文研究离散参量马尔柯夫决策规划问题。文中把通常按数学期望下的平均总报酬的平均目标最优准则,称为“弱最优”的,同时提出了按样本过程(或实现)的实际平均总报酮的“准强最优”与“强最优”准则,讨论了它们之间的关系及在什么条件下弱最优策略,也是准强最优、强最优的,证明了目前常用的两个弱最优策略存在的充分条件,也是在(?)上强最优策略存在的充分条件,等等。
出处
《数学年刊(A辑)》
SCIE
CSCD
北大核心
1993年第1期118-127,共10页
Chinese Annals of Mathematics