期刊文献+

Markov控制过程基于单个样本轨道的在线优化算法 被引量:5

On-line optimization algorithm for Markov control processes based on a single sample path
下载PDF
导出
摘要 在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的特征来选择适当的算法参数 ,因此它能满足不同实际工程系统在线优化的需要 .最后简要分析了这些算法在一个无限长的样本轨道上以概率 1的收敛性 ,并给出了一个三 状态受控Markov过程的数值实例 . Based on the theory of Markov performance potentials, this paper studies a performance optimization algorithm for Markov control processes. Different from the traditional computation-based approaches, this algorithm could estimate the gradients of performance with respect to the policy parameters by simulating a single sample path, and look for an optimal (or suboptimal) randomized stationary policy. The algorithm provided here could satisfy the needs of on-line optimization of many different real-world engineering systems, because we can select suitable parameters in the algorithm according to the properties of a real system. Finally, the convergence of the algorithm with probability one on an infinite sample path is considered, and a numerical example for a three-state controlled Markov chain is provided.
出处 《控制理论与应用》 EI CAS CSCD 北大核心 2002年第6期865-871,共7页 Control Theory & Applications
基金 国家自然科学基金 (699740 3 7) 国家高性能计算基金 (0 0 2 0 8)资助项目
关键词 MARKOV控制过程 单个样本轨道 在线优化算法 离散事件动态系统 随机平稳策略 Markov control processes Markov performance potentials randomized stationary policies on-line optimization
  • 相关文献

参考文献2

二级参考文献11

  • 1Cao X R 秦化淑.中国控制会议论文集[M].北京:中国科学技术出版社,1995.22-39.
  • 2Cao X R,IEEE Trans Automat Control,1997年,42卷,10期,1382页
  • 3Cao X R,中国控制会议论文集,1995年,22页
  • 4Cao X R,Realization Probabilities:the Dynamics of Queueing Systems,1994年
  • 5邓永录,随机模型及其应用,1994年
  • 6Cao Xiren,IEEE Trans Automat Control,1997年,42卷,10期,1382页
  • 7Cao Xiren,IEEE Trans Automat Control,1994年,39卷,7期,1460页
  • 8Chong E P,IEEE Trans Automat Control,1994年,37卷,7期,1440页
  • 9孙德敏,工程最优化.方法及应用,1991年,133页
  • 10Yao D D,IEEE Trans Automat Control,1989年,34卷,2期,236页

共引文献18

同被引文献10

引证文献5

二级引证文献20

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部