期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Polish空间上的折扣马氏过程量子化策略的渐近优化
1
作者
吴晓
孔荫莹
郭圳滨
《数学物理学报(A辑)》
CSCD
北大核心
2022年第2期594-604,共11页
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对...
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
展开更多
关键词
连续时间马尔可夫决策过程
依赖状态折扣因子
折扣准则
量子化平稳策略
渐近最优性
下载PDF
职称材料
可变折扣马氏决策过程首达模型列的收敛问题
2
作者
吴晓
郭圳滨
《应用概率统计》
CSCD
北大核心
2021年第6期598-610,共13页
本文主要研究了可数状态空间上带多约束、可变折扣马氏决策过程首达模型序列的收敛问题.利用``占有测度''及其相关性质,将受约束首达模型序列的优化问题转化为等价的受约束线性规划问题(凸分析方法),在合适条件下证明了首达模...
本文主要研究了可数状态空间上带多约束、可变折扣马氏决策过程首达模型序列的收敛问题.利用``占有测度''及其相关性质,将受约束首达模型序列的优化问题转化为等价的受约束线性规划问题(凸分析方法),在合适条件下证明了首达模型序列的最优值和最优策略收敛于``极限''模型的最优值和最优策略.
展开更多
关键词
马氏决策过程首达模型
多约束
依赖状态折扣因子
凸分析方法
收敛问题
下载PDF
职称材料
题名
Polish空间上的折扣马氏过程量子化策略的渐近优化
1
作者
吴晓
孔荫莹
郭圳滨
机构
肇庆学院数学与统计学院
广东财经大学智能财会管理学院
广发证券股份有限公司发展研究中心
出处
《数学物理学报(A辑)》
CSCD
北大核心
2022年第2期594-604,共11页
基金
国家自然科学基金(11961005)
中山大学广东省计算科学重点实验室开放基金(2021021)
+1 种基金
广东省普通高校重点领域(新一代信息技术)基金(2020ZDZX3019)
广州市科技计划项目(202102080420)。
文摘
该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.
关键词
连续时间马尔可夫决策过程
依赖状态折扣因子
折扣准则
量子化平稳策略
渐近最优性
Keywords
Continuous-time Markov decision processes
State-dependent discount factors
Discounted criterion
Quantized stationary policies
Asymptotic optimality
分类号
O211.6 [理学—概率论与数理统计]
下载PDF
职称材料
题名
可变折扣马氏决策过程首达模型列的收敛问题
2
作者
吴晓
郭圳滨
机构
肇庆学院数学与统计学院
广发证券股份有限公司发展研究中心
出处
《应用概率统计》
CSCD
北大核心
2021年第6期598-610,共13页
基金
国家自然科学基金项目(批准号:11961005)
广东省普通高校特色创新类项目基金(批准号:2018KTSCX253)资助.
文摘
本文主要研究了可数状态空间上带多约束、可变折扣马氏决策过程首达模型序列的收敛问题.利用``占有测度''及其相关性质,将受约束首达模型序列的优化问题转化为等价的受约束线性规划问题(凸分析方法),在合适条件下证明了首达模型序列的最优值和最优策略收敛于``极限''模型的最优值和最优策略.
关键词
马氏决策过程首达模型
多约束
依赖状态折扣因子
凸分析方法
收敛问题
Keywords
first passage Markov decision processes
multiple constraints
state-dependent discount factors convex analytic approach
convergence problem
分类号
O211.62 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Polish空间上的折扣马氏过程量子化策略的渐近优化
吴晓
孔荫莹
郭圳滨
《数学物理学报(A辑)》
CSCD
北大核心
2022
0
下载PDF
职称材料
2
可变折扣马氏决策过程首达模型列的收敛问题
吴晓
郭圳滨
《应用概率统计》
CSCD
北大核心
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部