期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划
被引量:
2
1
作者
伍从斌
《应用数学学报》
CSCD
北大核心
1997年第2期196-208,共13页
本文首次在报酬函数及转移速率族均非一致有界的条件下,对可数状态空间,可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数,在一类新的马氏策略中,讨论了最优策略的存在性及其结构,除证明了在有界报...
本文首次在报酬函数及转移速率族均非一致有界的条件下,对可数状态空间,可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数,在一类新的马氏策略中,讨论了最优策略的存在性及其结构,除证明了在有界报酬和一致有界转移速率族下成立的主要结果外,本文还得到一些重要结论.
展开更多
关键词
马氏决策规划
转移速率族
CTMDP
报酬函数
原文传递
题名
报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划
被引量:
2
1
作者
伍从斌
机构
清华大学应用数学系
出处
《应用数学学报》
CSCD
北大核心
1997年第2期196-208,共13页
基金
国家自然科学基金
云南省科委青年基金
文摘
本文首次在报酬函数及转移速率族均非一致有界的条件下,对可数状态空间,可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数,在一类新的马氏策略中,讨论了最优策略的存在性及其结构,除证明了在有界报酬和一致有界转移速率族下成立的主要结果外,本文还得到一些重要结论.
关键词
马氏决策规划
转移速率族
CTMDP
报酬函数
Keywords
Continuous time Markov decision process, unbounded reward, transition rate family, discounted criterion, optimal policy
分类号
O221.5 [理学—运筹学与控制论]
O211.62 [理学—概率论与数理统计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划
伍从斌
《应用数学学报》
CSCD
北大核心
1997
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部