检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Convergence of Markov decision processes with constraints and state-action dependent discount factors 被引量：2: 1; 作者 Xiao Wu Xianping Guo 《Science China Mathematics》 SCIE CSCD 2020年第1期167-182,共16页; This paper is concerned with the convergence of a sequence of discrete-time Markov decision processes(DTMDPs)with constraints,state-action dependent discount factors,and possibly unbounded costs.Using the convex analy... 展开更多; 关键词 discrete-time Markov decision processes state-action dependent discount factors unbounded costs CONVERGENCE; 原文传递

First passage Markov decision processes with constraints and varying discount factors 被引量：2: 2; 作者 Xiao WU Xiaolong ZOU Xianping GUO 《Frontiers of Mathematics in China》 SCIE CSCD 2015年第4期1005-1023,共19页; This paper focuses on the constrained optimality problem （COP） of first passage discrete-time Markov decision processes （DTMDPs） in denumerable state and compact Borel action spaces with multi-constraints, state-d... 展开更多; 关键词 Discrete-time Markov decision process （DTMDP） constrainedoptimality varying discount factor unbounded cost; 原文传递

TOTAL REWARD CRITERIA FOR UNCONSTRAINED/CONSTRAINED CONTINUOUS-TIME MARKOV DECISION PROCESSES: 3; 作者 Xianping GUO Lanlan ZHANG 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2011年第3期491-505,共15页; This paper studies denumerable continuous-time Markov decision processes with expected total reward criteria. The authors first study the unconstrained model with possible unbounded transition rates, and give suitable... 展开更多; 关键词 Constrained-optimal policy continuous-time Markov decision process optimal policy total reward criterion unbounded reward/cost and transition rates.; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	Convergence of Markov decision processes with constraints and state-action dependent discount factors	Xiao Wu Xianping Guo	《Science China Mathematics》 SCIE CSCD	2020	2	原文传递
2	First passage Markov decision processes with constraints and varying discount factors	Xiao WU Xiaolong ZOU Xianping GUO	《Frontiers of Mathematics in China》 SCIE CSCD	2015	2	原文传递
3	TOTAL REWARD CRITERIA FOR UNCONSTRAINED/CONSTRAINED CONTINUOUS-TIME MARKOV DECISION PROCESSES	Xianping GUO Lanlan ZHANG	《Journal of Systems Science & Complexity》 SCIE EI CSCD	2011	0	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部