期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
受控排队系统的平均最优与约束平均最优
被引量:
1
1
作者
张兰兰
郭先平
《控制理论与应用》
EI
CAS
CSCD
北大核心
2009年第2期139-144,共6页
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与...
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略.
展开更多
关键词
连续时间马尔可夫决策过程
平均准则
受控排队系统
平均
最优
平稳
策略
约束
平均
最优
策略
下载PDF
职称材料
受约束的非平稳期望总报酬模型
2
作者
郭先平
《数理统计与应用概率》
1996年第4期326-331,共6页
本文考虑的是状态空间和行动空间均为一般集的受约束的平稳期望总报酬模型首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约...
本文考虑的是状态空间和行动空间均为一般集的受约束的平稳期望总报酬模型首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约束最优策略的存在性从而既推广了无约束的ErikjBalder[10](1992)的模型。
展开更多
关键词
约束最优策略
期望总报酬
马氏决策规划
下载PDF
职称材料
约束折扣半马氏决策规划
被引量:
2
3
作者
胡光华
张升
《应用数学学报》
CSCD
北大核心
1997年第2期187-195,共9页
本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-...
本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-约束最优策略最后构造出一线性规划,证明了该线性规划的最优解与p-约束最优随机平稳策略之间存在——对应关系.
展开更多
关键词
半马氏决策规划
约束最优策略
线性规划
CDSMDP
原文传递
具有多个向量约束的折扣马氏决策规划
被引量:
1
4
作者
刘建庸
黄思明
胡光华
《科学通报》
EI
CAS
CSCD
北大核心
1995年第16期1448-1451,共4页
文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条...
文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条件下,该文证明了存在混合平稳策略是约束最优策略,并给出了算法.文献[2]给出了在马氏策略类及平稳策略类中求约束最优策略的算法.
展开更多
关键词
马氏决策规划
向量
约束
约束最优策略
原文传递
题名
受控排队系统的平均最优与约束平均最优
被引量:
1
1
作者
张兰兰
郭先平
机构
南方医科大学公共卫生与热带医学学院
中山大学数学与计算科学学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2009年第2期139-144,共6页
基金
国家自然科学基金资助项目(60874004)
教育部博士点基金资助课题(20050558022).
文摘
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件.这个新条件仅使用模型的初始数据,但利用了生灭过程的遍历性理论.可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略.
关键词
连续时间马尔可夫决策过程
平均准则
受控排队系统
平均
最优
平稳
策略
约束
平均
最优
策略
Keywords
continuous-time Markov decision processes
average criterion
controlled queuing systems
average optimal stationary policy
constrained average optimal policy
分类号
O224 [理学—运筹学与控制论]
下载PDF
职称材料
题名
受约束的非平稳期望总报酬模型
2
作者
郭先平
机构
中山大学数学系
出处
《数理统计与应用概率》
1996年第4期326-331,共6页
文摘
本文考虑的是状态空间和行动空间均为一般集的受约束的平稳期望总报酬模型首先证明了随机策略类及最优策略类的紧性,然后,利用引入Lagrange乘子的技巧,在放弃通常的对期望费用的强约束假设下,用拓扑分析的方法,证明了约束最优策略的存在性从而既推广了无约束的ErikjBalder[10](1992)的模型。
关键词
约束最优策略
期望总报酬
马氏决策规划
分类号
O211.62 [理学—概率论与数理统计]
O221.5 [理学—运筹学与控制论]
下载PDF
职称材料
题名
约束折扣半马氏决策规划
被引量:
2
3
作者
胡光华
张升
机构
云南大学数学系
出处
《应用数学学报》
CSCD
北大核心
1997年第2期187-195,共9页
文摘
本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-约束最优策略最后构造出一线性规划,证明了该线性规划的最优解与p-约束最优随机平稳策略之间存在——对应关系.
关键词
半马氏决策规划
约束最优策略
线性规划
CDSMDP
Keywords
Semi-Markov decision process, P-constraint optimal policy, Linear programming
分类号
O221.5 [理学—运筹学与控制论]
O211.62 [理学—概率论与数理统计]
原文传递
题名
具有多个向量约束的折扣马氏决策规划
被引量:
1
4
作者
刘建庸
黄思明
胡光华
机构
中国科学院应用数学研究所
香港科技大学工商管理学院管理学系
云南大学数学系
出处
《科学通报》
EI
CAS
CSCD
北大核心
1995年第16期1448-1451,共4页
基金
香港科技大学基金(DAG92/93.BM15)
国家自然科学基金
云南省青年基金资助项目
文摘
文献[1]讨论了具有一个向量约束的折扣马氏决策规划,该文将约束最优问题化为一个Lagrange规划问题.但该文没有解决约束最优策略的存在性问题,也没有给出有效的算法.胡光华文中讨论了具有一个实数值约束的折扣半马氏决策规划.在适当的条件下,该文证明了存在混合平稳策略是约束最优策略,并给出了算法.文献[2]给出了在马氏策略类及平稳策略类中求约束最优策略的算法.
关键词
马氏决策规划
向量
约束
约束最优策略
分类号
O225 [理学—运筹学与控制论]
O211.62 [理学—概率论与数理统计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
受控排队系统的平均最优与约束平均最优
张兰兰
郭先平
《控制理论与应用》
EI
CAS
CSCD
北大核心
2009
1
下载PDF
职称材料
2
受约束的非平稳期望总报酬模型
郭先平
《数理统计与应用概率》
1996
0
下载PDF
职称材料
3
约束折扣半马氏决策规划
胡光华
张升
《应用数学学报》
CSCD
北大核心
1997
2
原文传递
4
具有多个向量约束的折扣马氏决策规划
刘建庸
黄思明
胡光华
《科学通报》
EI
CAS
CSCD
北大核心
1995
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部