不完全信息的非平稳MDP平均模型

Non -stationary MDP Average Model In complete Information

下载PDF

导出

摘要本文考虑的是可数状态空间不完全信息的非平稳MDP平均模型,借助于模型的转化,建立了不完全信息的非平稳MDP平均模型的最优方程,并进一步给出了最优方程的解及ε(>,0)——最优策略存在的充分条件。 In this paper, We consider the denumable state space non- stationary MDP average model with incomplete information, By the translation of the model, We build up a optimal equation (OE) for the MDP average Model with incomplete Information, and also give the condition under which the solution of OE and the ε-optimal policies must exist.

作者郭先平

机构地区长沙铁道学院科研所

出处《数理统计与应用概率》 1995年第2期14-21,共8页

关键词马氏决策规划不完全信息平均目标平均模型 Markov Decision Programming (MDP) Incomplete Information Non -stationary Average criteria.

分类号 O211.62 [理学—概率论与数理统计] O221 [理学—运筹学与控制论]

引文网络
相关文献

参考文献1

1魏力仁,郭先平.非平稳MDP的平均模型——一般状态空间的情形[J].科学通报,1991,36(10):728-730. 被引量：2

共引文献1

1郭先平.非平稳MDP平均模型及其算法[J].应用数学与计算数学学报,1995,9(2):53-59. 被引量：1

1郭先平.非平稳MDP平均模型—状态空间可数情形[J].湖南师范大学自然科学学报,1991,14(4):302-308.
2郭先平.非平稳MDP平均模型的ε(≥O)-最优策略存在的充分条件[J].湖南师范大学自然科学学报,1992,15(4):300-304.
3魏力仁,郭先平.非平稳MDP的平均模型——一般状态空间的情形[J].科学通报,1991,36(10):728-730. 被引量：2
4郭先平.MDP平均模型的强最优性[J].湖南师范大学自然科学学报,1996,19(1):21-24.
5郭先平,刘武旺.非平稳MDP平均模型ε_n－最优策略的结构[J].湖南师范大学自然科学学报,1994,17(3):1-7.
6郭先平,刘建庸,刘克.非平稳MDP平均模型及其滚动式算法[J].系统科学与数学,1999,19(4):439-446. 被引量：1
7郭先平.利用期望状态转移逼近MDP平均模型[J].湖南师范大学自然科学学报,1989,12(4):301-305.
8郭先平.非平稳MDP平均模型── 一致最优(G,B)-生成策略的存在性[J].数学学报（中文版）,2000,43(2):269-274.
9Tai-Wen HSU,Chin-Yen TSAI.RANS Modeling of Solitary Wave Propagation over A Submerged Rectangular Breakwater[J].China Ocean Engineering,2009,23(3):473-488. 被引量：1
10郭先平.可数状态MDP的平均模型[J].数学年刊（A辑）,1996,1(5):539-546. 被引量：1

数理统计与应用概率

1995年第2期

浏览历史

内容加载中请稍等...

不完全信息的非平稳MDP平均模型

参考文献1

共引文献1

相关作者

相关机构

相关主题

浏览历史