期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
半Markov决策过程的数值迭代优化
被引量:
2
1
作者
唐昊
吴玉华
周雷
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第1期108-112,共5页
针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机...
针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。
展开更多
关键词
计算机应用
半MARKOV决策过程
等价无穷小生成子
异步数值迭代
下载PDF
职称材料
题名
半Markov决策过程的数值迭代优化
被引量:
2
1
作者
唐昊
吴玉华
周雷
机构
合肥工业大学计算机与信息学院
出处
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006年第1期108-112,共5页
基金
国家自然科学基金资助项目(60404009)
安徽省自然科学基金资助项目(050420303)
合肥工业大学中青年科技创新群体计划项目
文摘
针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。
关键词
计算机应用
半MARKOV决策过程
等价无穷小生成子
异步数值迭代
Keywords
computer application
semi-Markov decision process
equivalent infinitesimal generator
asynchronous value iteration
分类号
TP202 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
半Markov决策过程的数值迭代优化
唐昊
吴玉华
周雷
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2006
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部