一类连续时间平均马氏决策平稳最优策略的存在性被引量：1

导出

摘要 1.引言我们将在可测(确定性)马氏策略类Π_m^d(c)中讨论连续时间平均马氏决策(简称平均CTMDP):{S,(A(i),(?)(i),i∈S),q,r,(?)}.本文假设状态空间 S 为可列集;行动集 A(i)为一般点集,(A(i),(?)(i),i∈S)为可测空间,任给 a∈A(i),要求{a}∈(?)(i);q 是保守的转移速率族;报酬率 r 是一致有界的可测函数,即存在 M<∞,使|r(i,a)|≤M 对 i∈S,a∈A(i)成立.对π∈Π_m^d(c),i∈S,平均报酬函数(?)定义为:

作者郑少慧

机构地区山东矿业学院

出处《应用数学学报》 CSCD 北大核心 1989年第2期250-256,共7页 Acta Mathematicae Applicatae Sinica

关键词马氏决策平稳最优策略数学规划

分类号 O221 [理学—运筹学与控制论]

引文网络
相关文献

参考文献3

1宋京生，1984年
2董泽清，1982年
3董泽清，Sci Chin B，1979年，131页

同被引文献4

1张桂琴,张仰森.直线往复式轨道自动导引车智能调度算法[J].计算机工程,2009,35(15):176-178. 被引量：28
2沈艳,郭兵.网络控制系统变采样周期智能动态调度策略[J].四川大学学报（工程科学版）,2010,42(1):162-167. 被引量：8
3查振元,李计星,绳润涛,张丰华,李昌臣.智能平移轨道导引车的应用[J].机器人技术与应用,2017(5):42-43. 被引量：4
4陈明,周云龙,刘晋飞,靳文瑞.基于MDP的多Agent生产线动态调度策略[J].机电一体化,2017,23(11):15-19. 被引量：7

引证文献1

1袁梦婷,杨碧容,孙瑞,吕平.环形智能加工系统中RGV的动态调度策略[J].价值工程,2019,38(27):43-45. 被引量：1

二级引证文献1

1王和旭,谢飞,张伟.口腔设备加工系统的RGV动态调度[J].西北大学学报（自然科学版）,2020,50(1):16-22. 被引量：1

1郑少慧.具有多项式报酬率的连续时间平均马氏决策规划[J].山东矿业学院学报,1989,8(1):84-90.
2曾庆宁.折扣多目标马氏决策规划的两种模糊最优策略[J].西安电子科技大学学报,1989,16(1):112-121. 被引量：2
3郑少慧.具有平均准则的离散马氏规划——最优平稳策略存在的较弱条件[J].山东矿业学院学报,1989,8(4):95-100.
4陈峥.二步马氏折扣模型最优策略的结构[J].青岛海洋大学学报（自然科学版）,1993,23(4):146-150.
5耿志勇,Char.,FJ.多项目维修系统的优化[J].锦州工学院学报,1990,9(3):52-61.
6曾庆宁.向量值半Markov决策规划的线性加权解法[J].应用数学,2001,14(S1):77-80.
7陈峥.二步马氏折扣模型的最优策略[J].青岛海洋大学学报（自然科学版）,1993,23(1):130-134. 被引量：1
8魏文元.Π_m^d上有界报酬折扣马氏决策模型最优策略的几个等价条件[J].天津师大学报（自然科学版）,1990(1):22-26.
9郭世贞,张昇.非齐时折扣马氏决策规划最优策略的结构[J].昆明工学院学报,1991,16(1):80-87.
10胡奇英,刘勇.离散事件系统静态稳定性的马氏决策过程方法[J].应用数学学报,2001,24(3):377-383. 被引量：4

应用数学学报

1989年第2期

浏览历史

内容加载中请稍等...

一类连续时间平均马氏决策平稳最优策略的存在性被引量：1

参考文献3

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一类连续时间平均马氏决策平稳最优策略的存在性 被引量：1

参考文献3

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一类连续时间平均马氏决策平稳最优策略的存在性被引量：1