期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
MDP 中非时齐折扣模型向时齐折扣模型的转化问题
1
作者 张继红 谭兴华 王跃宏 《昆明工学院学报》 1997年第6期30-36,共7页
在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴... 在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分,这就带来了非时齐折扣模型的完满结论。 展开更多
关键词 非时齐折扣mdp 折扣mdp 模型转化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部