期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
连续时间Markov决策过程的均值-方差优化问题
1
作者
叶柳儿
黄香香
《中国科学:数学》
CSCD
北大核心
2014年第8期883-898,共16页
本文考虑连续时间Markov决策过程折扣模型的均值-方差优化问题.假设状态空间和行动空间均为Polish空间,转移率和报酬率函数均无界.本文的优化目标是在折扣最优平稳策略类里,选取相应方差最小的策略.本文致力于寻找Polish空间下Markov决...
本文考虑连续时间Markov决策过程折扣模型的均值-方差优化问题.假设状态空间和行动空间均为Polish空间,转移率和报酬率函数均无界.本文的优化目标是在折扣最优平稳策略类里,选取相应方差最小的策略.本文致力于寻找Polish空间下Markov决策过程均值-方差最优策略存在的条件.利用首次进入分解方法,本文证明均值-方差优化问题可以转化为"等价"的期望折扣优化问题,进而得到关于均值-方差优化问题的"最优方程"和均值-方差最优策略的存在性以及它相应的特征.最后,本文给出若干例子说明折扣最优策略的不唯一性和均值-方差最优策略的存在性.
展开更多
关键词
连续时间Markov决策过程
折扣最优化
方差最小
均值-方差最优策略
原文传递
题名
连续时间Markov决策过程的均值-方差优化问题
1
作者
叶柳儿
黄香香
机构
暨南大学经济学院统计学系
中山大学数学与计算科学学院
出处
《中国科学:数学》
CSCD
北大核心
2014年第8期883-898,共16页
基金
国家自然科学基金(批准号:11201182)
中央高校基本科研业务费专项资金(批准号:21612314)
中山大学广东省计算科学重点实验室开放基金(批准号:201206010)资助项目
文摘
本文考虑连续时间Markov决策过程折扣模型的均值-方差优化问题.假设状态空间和行动空间均为Polish空间,转移率和报酬率函数均无界.本文的优化目标是在折扣最优平稳策略类里,选取相应方差最小的策略.本文致力于寻找Polish空间下Markov决策过程均值-方差最优策略存在的条件.利用首次进入分解方法,本文证明均值-方差优化问题可以转化为"等价"的期望折扣优化问题,进而得到关于均值-方差优化问题的"最优方程"和均值-方差最优策略的存在性以及它相应的特征.最后,本文给出若干例子说明折扣最优策略的不唯一性和均值-方差最优策略的存在性.
关键词
连续时间Markov决策过程
折扣最优化
方差最小
均值-方差最优策略
Keywords
continuous-time Markov decision processes, discounted optimality, variance minimization~ mean-variance optimal policy
分类号
O211.62 [理学—概率论与数理统计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
连续时间Markov决策过程的均值-方差优化问题
叶柳儿
黄香香
《中国科学:数学》
CSCD
北大核心
2014
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部