期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
向量值有限平均MDP
1
作者 贾让成 《西北师范大学学报(自然科学版)》 CAS 1994年第3期16-19,共4页
讨论了向量值离散时间平均准则下的有限马氏决策模型;在采取确定性平稳策略时所得马氏决策过程为遍历的假设下,证明了存在一个至多在K-1个状态是随机的平稳最优策略,并给出了其线性规划算法。同时证明了存在强最优策略的充要条件... 讨论了向量值离散时间平均准则下的有限马氏决策模型;在采取确定性平稳策略时所得马氏决策过程为遍历的假设下,证明了存在一个至多在K-1个状态是随机的平稳最优策略,并给出了其线性规划算法。同时证明了存在强最优策略的充要条件是其存在强确定性平稳最优策略。 展开更多
关键词 向量值 平均准则 马氏决策过程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部