平均多目标马氏决策规划

AVERAGE MULTI-OBJECTIVE MARKOV DECISION PROGRAMMING

下载PDF

导出

摘要本文定义了平均多目标马氏决策规划,讨论了它的平稳策略优势及其局限性,并在平稳策略集上给出了策略改进迭代求解法. Average Multi-objective Markov Decision Programming is defined in this paper.The dominant positions and the limitations of the stationary strategies are discussed and an iterative algorithm is given to solve the programming on the stationary strategy set.

作者曾庆宁

机构地区桂林电子工业学院

出处《系统工程》 CSCD 1989年第1期25-32,共8页 Systems Engineering

关键词马氏决策规划平均MOMDP 平稳策略

分类号 O221 [理学—运筹学与控制论]

引文网络
相关文献

1曾庆宁.DMOMDP及其П_m^d与П_S^d优势[J].桂林电子工业学院学报,1989,9(1):18-23.
2曾庆宁.平稳策略类上DMOMDP的求解法[J].桂林电子工业学院学报,1989,9(2):84-89.
3刘克,刘建庸.向量值半Markov决策规划[J].科学通报,1990,35(18):1364-1367. 被引量：5
4郑少慧.具有平均准则的离散马氏规划——最优平稳策略存在的较弱条件[J].山东矿业学院学报,1989,8(4):95-100.
5张道智.依赖于历史的折扣半马氏决策规划[J].清华大学学报（自然科学版）,1989,29(3):30-39.
6郭先平.MDP平均模型的强最优性[J].湖南师范大学自然科学学报,1996,19(1):21-24.
7颜铁成.多阶段随机规划中的一类可行策略[J].系统工程学报,1995,10(2):41-47. 被引量：4
8Masahiko SAKAGUCHI,Yoshio OHTSUBO.Markov decision processes associated with two threshold probability criteria[J].控制理论与应用（英文版）,2013,11(4):548-557.
9许青松.观察过程状态数为可数的POMDP的算法[J].湖南大学学报（自然科学版）,1996,23(1):25-32.
10许青松.部分可观的马尔可夫决策规划折扣模型的解法[J].湖南大学学报（自然科学版）,1995,22(5):16-20.

系统工程

1989年第1期

浏览历史

内容加载中请稍等...

平均多目标马氏决策规划

相关作者

相关机构

相关主题

浏览历史