期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
MDP 中非时齐折扣模型向时齐折扣模型的转化问题
1
作者
张继红
谭兴华
王跃宏
《昆明工学院学报》
1997年第6期30-36,共7页
在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴...
在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分,这就带来了非时齐折扣模型的完满结论。
展开更多
关键词
非时齐折扣mdp
时
齐
折扣
mdp
模型转化
下载PDF
职称材料
题名
MDP 中非时齐折扣模型向时齐折扣模型的转化问题
1
作者
张继红
谭兴华
王跃宏
机构
昆明理工大学基础部
新疆有色金属工业学校
云南工业大学
出处
《昆明工学院学报》
1997年第6期30-36,共7页
文摘
在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分,这就带来了非时齐折扣模型的完满结论。
关键词
非时齐折扣mdp
时
齐
折扣
mdp
模型转化
Keywords
nonstationary discounted
mdp
stationary discounted
mdp
transformation of models
(S t, ε)optimal policy
optimal policy
ε optimal policy
分类号
O221 [理学—运筹学与控制论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
MDP 中非时齐折扣模型向时齐折扣模型的转化问题
张继红
谭兴华
王跃宏
《昆明工学院学报》
1997
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部