检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种基于最优策略概率分布的POMDP值迭代算法被引量：4: 1; 作者刘峰王崇骏骆斌《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页; 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 展开更多; 关键词部分可观测马尔科夫决策过程基于最优策略概率的值迭代算法蒙特卡罗法; 下载PDF 职称材料

Adaptive dynamic programming for finite-horizon optimal control of linear time-varying discrete-time systems 被引量：3: 2; 作者 Bo PANG Tao BIAN Zhong-Ping JIANG 《Control Theory and Technology》 EI CSCD 2019年第1期73-84,共12页; This paper studies data-driven learning-based methods for the finite-horizon optimal control of linear time-varying discretetime systems. First, a novel finite-horizon Policy Iteration (PI) method for linear time-vary... 展开更多; 关键词 optimal control TIME-VARYING system adaptive dynamic PROGRAMMING policy iteration (PI) value iteration(VI); 原文传递

Optimal stopping time on discounted semi-Markov processes: 3; 作者 Fang CHEN Xianping GUO Zhong-Wei LIAO 《Frontiers of Mathematics in China》 SCIE CSCD 2021年第2期303-324,共22页; This paper attempts to study the optimal stopping time for semi- Markov processes (SMPs) under the discount optimization criteria with unbounded cost rates. In our work, we introduce an explicit construction of the eq... 展开更多; 关键词 optimal stopping time semi-Markov processes(SMPs) value function semi-Markov decision processes(SMDPs) optimal policy iterative lgorithm; 原文传递

基于半马氏的无限阶段指数效用最优模型: 4; 作者温鲜霍海峰《应用概率统计》 CSCD 北大核心 2023年第4期577-588,共12页; 本文考虑半马氏决策过程的指数效用最优问题,其中状态和行动空间均为Borel集,报酬函数非负.最优准则是最大化系统无限阶段内获取总报酬指数效用的期望值.首先,建立标准正则性条件确保状态过程非爆炸,连续-紧条件确保最优策略存在.其次,... 展开更多; 关键词半马氏决策过程指数效用值迭代最优方程最优策略; 下载PDF 职称材料

马尔可夫过程在物价渡动研究中的应用——策略迭代在考虑钱币损失的经济系统中的实现: 5; 作者马文《贵州师范大学学报（自然科学版）》 CAS 1993年第1期24-32,共9页; 本文利用马尔可夫过程理论研究了某货物价格变动的有关規律。这是系列研究的第三部份。; 关键词马尔可夫过程转移概率矩阵物价; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种基于最优策略概率分布的POMDP值迭代算法	刘峰王崇骏骆斌	《电子学报》 EI CAS CSCD 北大核心	2016	4	下载PDF 职称材料
2	Adaptive dynamic programming for finite-horizon optimal control of linear time-varying discrete-time systems	Bo PANG Tao BIAN Zhong-Ping JIANG	《Control Theory and Technology》 EI CSCD	2019	3	原文传递
3	Optimal stopping time on discounted semi-Markov processes	Fang CHEN Xianping GUO Zhong-Wei LIAO	《Frontiers of Mathematics in China》 SCIE CSCD	2021	0	原文传递
4	基于半马氏的无限阶段指数效用最优模型	温鲜霍海峰	《应用概率统计》 CSCD 北大核心	2023	0	下载PDF 职称材料
5	马尔可夫过程在物价渡动研究中的应用——策略迭代在考虑钱币损失的经济系统中的实现	马文	《贵州师范大学学报（自然科学版）》 CAS	1993	0	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部