期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
MDP平均模型强最优问题
1
作者
邱德华
《衡阳师范学院学报》
1993年第3期1-11,共11页
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了...
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。
展开更多
关键词
马尔科夫决策
非时齐平均模型MDP弱
最优
策略
准强最优策略
强最
优
策略
下载PDF
职称材料
题名
MDP平均模型强最优问题
1
作者
邱德华
出处
《衡阳师范学院学报》
1993年第3期1-11,共11页
文摘
对MDP平均模型,本文提出了准强最优与强最优标准问题,首次讨论了非时齐MDP平均模型,在状态空间可数而行动集有限和适当条件下,得到在上存在弱最优决定性马氏策略(通常意义下),并且此策略在上是准强最优的,而在上是强最优的,同时讨论了时齐情况。包含了已知的一些结果。
关键词
马尔科夫决策
非时齐平均模型MDP弱
最优
策略
准强最优策略
强最
优
策略
Keywords
Markov decision
non-stationary average reward MDP
weak optimal policy quasistrong optimal policy
strong optimal policy
分类号
G658.3 [文化科学—教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
MDP平均模型强最优问题
邱德华
《衡阳师范学院学报》
1993
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部