期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
半马氏MDP平均模型
1
作者
邱德华
《衡阳师专学报》
1998年第3期1-7,共7页
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。
关键词
最优方程
最优平稳策略
半马氏MDP模型
解
下载PDF
职称材料
非时齐折扣马氏决策规划(一)
被引量:
1
2
作者
张升
郭世贞
《云南大学学报(自然科学版)》
CAS
CSCD
1990年第4期285-292,共8页
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件.
关键词
马氏决策规划
动态规划
最优策略
原文传递
连续时间马尔可夫决策过程的折扣模型
3
作者
郭先平
戴永隆
《数学学报(中文版)》
SCIE
CSCD
北大核心
2002年第1期171-182,共12页
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, ...
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, 费用率函数可能无界, 且允许行动空间非空任意的情形. 本文首次用"α-折扣费用最优不等式"更新了传统的α-折扣费用最优方程,并用"最优不等式"和新的方法,不仅证明了传统的主要结果即最优平稳策略的存在性, 而且还进一步探讨了( ∈>0 )-最优平稳策略,具有单调性质的最优平稳策略, 以及(∈≥0) -最优决策过程的存在性, 得到了一些有意义的新结果. 最后, 提供了一个迁移率受控的生灭系统例子, 它满足本文的所有条件, 而传统的假设(见文献[1-14])均不成立.
展开更多
关键词
Q-过程
无界费用
单调最优策略
连续时间马尔可夫决策过程
折扣模型
原文传递
题名
半马氏MDP平均模型
1
作者
邱德华
机构
衡阳师范高等专科学校数学系
出处
《衡阳师专学报》
1998年第3期1-7,共7页
文摘
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。
关键词
最优方程
最优平稳策略
半马氏MDP模型
解
Keywords
Semi-markov decision programming with average criterion
optimal equations
ε(≥0)
-optimal
stationary
policies
分类号
O211.62 [理学—概率论与数理统计]
O221.5 [理学—运筹学与控制论]
下载PDF
职称材料
题名
非时齐折扣马氏决策规划(一)
被引量:
1
2
作者
张升
郭世贞
机构
云南大学数学系
昆明工学院
出处
《云南大学学报(自然科学版)》
CAS
CSCD
1990年第4期285-292,共8页
文摘
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件.
关键词
马氏决策规划
动态规划
最优策略
Keywords
discounted Markovian decision programming, non-
stationary
dynamic programming, ε (≥0) optimal policy
分类号
O221 [理学—运筹学与控制论]
原文传递
题名
连续时间马尔可夫决策过程的折扣模型
3
作者
郭先平
戴永隆
机构
中山大学统计系
出处
《数学学报(中文版)》
SCIE
CSCD
北大核心
2002年第1期171-182,共12页
基金
国家自然科学基金(19361060)
广东省自然科学基金
香港中山大学高等学术中心基金会资助项目
文摘
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的 Q -过程唯一等条件,而首次考虑相应每个策略的 Q -过程不一定唯一, 转移速率族也不一定保守, 费用率函数可能无界, 且允许行动空间非空任意的情形. 本文首次用"α-折扣费用最优不等式"更新了传统的α-折扣费用最优方程,并用"最优不等式"和新的方法,不仅证明了传统的主要结果即最优平稳策略的存在性, 而且还进一步探讨了( ∈>0 )-最优平稳策略,具有单调性质的最优平稳策略, 以及(∈≥0) -最优决策过程的存在性, 得到了一些有意义的新结果. 最后, 提供了一个迁移率受控的生灭系统例子, 它满足本文的所有条件, 而传统的假设(见文献[1-14])均不成立.
关键词
Q-过程
无界费用
单调最优策略
连续时间马尔可夫决策过程
折扣模型
Keywords
Q-processes Being not unique
Unbounded costs
(∈>0)
-optimal
stationary
policy
(∈≥0)
-optimal
decision process
Monotone optimal policy
分类号
O221.5 [理学—运筹学与控制论]
O211.62 [理学—概率论与数理统计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
半马氏MDP平均模型
邱德华
《衡阳师专学报》
1998
0
下载PDF
职称材料
2
非时齐折扣马氏决策规划(一)
张升
郭世贞
《云南大学学报(自然科学版)》
CAS
CSCD
1990
1
原文传递
3
连续时间马尔可夫决策过程的折扣模型
郭先平
戴永隆
《数学学报(中文版)》
SCIE
CSCD
北大核心
2002
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部