期刊文献+

连续时间MDP及其与离散时间MDP的关系 被引量:4

原文传递
导出
摘要 本文讨论的连续时间MDP(Continuous Time MDP,简记为CTMDP)折扣模型为{S,(A(i),(i),i∈S),q,r,a},其中状态集S可列;行动集A(i)为任意非空集,(i)为其上的σ-代数,它包含A(i)的所有单点集;转移速率族q(j|i,a)满足:i∈S,a∈A(i)均有—∞<q(j|i,a)≤0及∑q(j|i,a)=0;r(i,a)为报酬率函数。
作者 胡奇英
出处 《科学通报》 EI CAS CSCD 北大核心 1989年第6期408-411,共4页 Chinese Science Bulletin
  • 相关文献

参考文献2

  • 1董泽清,科学通报,1987年,32卷,11期,808页
  • 2宋京生,中国科学.A,1987年,12期,1258页

同被引文献9

引证文献4

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部