期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
半Markov决策过程的数值迭代优化 被引量:2
1
作者 唐昊 吴玉华 周雷 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第1期108-112,共5页
针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机... 针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。 展开更多
关键词 计算机应用 半MARKOV决策过程 等价无穷小生成子 异步数值迭代
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部