期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
连续时间的折扣向量值马氏决策模型 被引量:1
1
作者 秦叔明 刘俊 王莉 《昆明理工大学学报(自然科学版)》 CAS 1996年第S1期73-76,共4页
将连续时间标量值折扣马氏决策模型(简记为MDP)的主要结果(最优方程,平稳策略优势,最优策略)均在向量值模型中作了推广,使标量值模型成为其特款.
关键词 连续时间 向量值马氏决策模型 平稳策略优势
下载PDF
非时齐向量值马氏决策模型
2
作者 秦叔明 张升 《应用概率统计》 CSCD 北大核心 2000年第1期57-65,共9页
章云等[2]讨论了一类报酬函数绝对平均相对有界的非时齐向量值马氏决策模型(简记为VMDP),得出了一最优策略存在的充分条件,并讨论了强最优和最优的关系,张升等[3]导出了该模型的几个性质. 本文讨论在满足一类报酬函数... 章云等[2]讨论了一类报酬函数绝对平均相对有界的非时齐向量值马氏决策模型(简记为VMDP),得出了一最优策略存在的充分条件,并讨论了强最优和最优的关系,张升等[3]导出了该模型的几个性质. 本文讨论在满足一类报酬函数绝对平均相对有界条件下的非时齐VMDP,将非时齐标量值马氏决策模型的主要结论(策略是最优策略的充要条件,最优方程,马氏策略优势等)在此作了推广. 展开更多
关键词 非时齐 向量值马氏决策 最优方程 马氏策略优势
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部