检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种解决连续空间问题的真实在线自然梯度AC算法被引量：5: 1; 作者朱斐朱海军 +2 位作者刘全陈冬火伏玉琛《软件学报》 EI CSCD 北大核心 2018年第2期267-282,共16页; 策略梯度作为一种能够有效解决连续空间决策问题的方法得到了广泛研究,但由于在策略估计过程中存在较大方差,因此,基于策略梯度的方法往往受到样本利用率低、收敛速度慢等限制.针对该问题,在行动者-评论家(actor-critic,简称AC)算法框架... 展开更多; 关键词策略梯度自然梯度行动者-评论家真实在线td 核方法; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种解决连续空间问题的真实在线自然梯度AC算法	朱斐朱海军刘全陈冬火伏玉琛	《软件学报》 EI CSCD 北大核心	2018	5	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部