无限阶段部分可观察马尔可夫决策规划被引量：1

PARTIALLY OBSERVABLE MARKOV DECISION PROGRAMMING OVER THE INFINITE HORIZON

下载PDF

导出

摘要本文对[1,2]所考虑的无限阶段折扣费用部分可观察马尔可夫决策规划作了进一步的讨论,澄清了其中的一些模糊概念,补充或纠正了其中的疏漏和错误,特别地,在保持费用函数分片线性的原则下扩大了有限瞬时策略类,最后给出了几个新的结论,并对[1]中的策略迭代算法给出了修正及收敛估计。 In this paper, we have a further discussion on the infinite horizon partially observable Markov decision programming with discount costs, which has been considered by Sondik and Sawaki. We clarify some fuzzy concepts in [1,2] and correct some mistakes in [2]. Under the condition in which the cost function is piecewise linear, we extend the class of finitely transient policy. Finally, some new conclusions and an estimation of convergence on the policy iteration algorithm are given.

作者刘迪芬刘克刘建庸

机构地区湖南师范大学数学系中科院应用数学研究所

出处《高校应用数学学报（A辑）》 CSCD 北大核心 1993年第2期210-221,共12页 Applied Mathematics A Journal of Chinese Universities(Ser.A)

基金国家青年科学基金

关键词瞬时策略马氏决策规划迭代法 Markov Decision Programming, Transient Policy, Piecewise-linear, Iteration Algorithm, Estimation of Convergence.

分类号 O211.6 [理学—概率论与数理统计]

引文网络
相关文献

参考文献1

1刘迪芬，系统科学与数学，1993年，13卷，2期，158页

同被引文献3

1韩松臣,秦俊奇,韩品尧,邵成勋.马尔可夫决策过程在目标分配中的应用[J].哈尔滨工业大学学报,1996,28(2):32-36. 被引量：12
2胡锡健,韩东,朱维宝.股票价格的回归—马氏链分析与预测[J].预测,1997,16(5):66-68. 被引量：9
3罗捍东.证券动态投资策略[J].预测,1999,18(2):53-54. 被引量：5

引证文献1

1韩苗,薛秀谦,周圣武,康建林.股票投资的马尔可夫决策规划模型[J].中国矿业大学学报,2005,34(2):261-264. 被引量：2

二级引证文献2

1蒋蓉华,李升泽.用Delphi实现基于马氏链的股票走势分析技术的研究[J].商业研究,2008(3):207-211. 被引量：5
2黄启堂,董建文,王艳霞,章志都.福建省南山风景区景观动态预测[J].热带作物学报,2009,30(5):704-709. 被引量：1

1刘迪芬,刘克,刘建庸.随机折扣部分可观察马尔可夫决策规划[J].系统科学与数学,1993,13(2):152-159. 被引量：1
2刘迪芬,刘建庸,刘克.部分可观察马尔可夫决策规划──首达目标模型[J].应用数学学报,1994,17(1):44-58.
3胡奇英.状态部分可观察的无界报酬马氏决策规划[J].数理统计与应用概率,1998,13(3):79-86. 被引量：3
4石东洋,蒋慧琴.四阶特征问题的线性有限元逼近[J].郑州工学院学报,1994,15(3):87-91.
5黄永辉,郭先平.非负费用折扣半马氏决策过程[J].数学学报（中文版）,2010,53(3):503-514. 被引量：2
6武震东,丁睿.一类抛物型变分不等式的有限元近似收敛估计[J].应用数学学报,2006,29(4):707-713. 被引量：1
7何照凯,胡晓敏,郑李平.一类新的q-Durrmeyer算子的逼近性质[J].杭州电子科技大学学报（自然科学版）,2012,32(2):93-95. 被引量：1
8钟乐凡,沈燮昌.插值多项式对解析部分的收敛估计[J].Journal of Mathematical Research and Exposition,1993,13(4):595-598.
9周芳,黄娟.一维双极漂移——扩散方程在半空间上的解的渐近性[J].湖北科技学院学报,2012,32(12):67-69.
10刘坤会.一个优化问题的辅助模型解法[J].北方交通大学学报,1992,16(1):40-52.

高校应用数学学报（A辑）

1993年第2期

浏览历史

内容加载中请稍等...

无限阶段部分可观察马尔可夫决策规划被引量：1

参考文献1

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

无限阶段部分可观察马尔可夫决策规划 被引量：1

参考文献1

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

无限阶段部分可观察马尔可夫决策规划被引量：1