期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划 被引量:2
1
作者 伍从斌 《应用数学学报》 CSCD 北大核心 1997年第2期196-208,共13页
本文首次在报酬函数及转移速率族均非一致有界的条件下,对可数状态空间,可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数,在一类新的马氏策略中,讨论了最优策略的存在性及其结构,除证明了在有界报... 本文首次在报酬函数及转移速率族均非一致有界的条件下,对可数状态空间,可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数,在一类新的马氏策略中,讨论了最优策略的存在性及其结构,除证明了在有界报酬和一致有界转移速率族下成立的主要结果外,本文还得到一些重要结论. 展开更多
关键词 马氏决策规划 转移速率族 CTMDP 报酬函数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部