检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于多Agent并行采样和学习经验复用的E^3算法被引量：2: 1; 作者刘全杨旭东 +1 位作者荆玲肖飞《吉林大学学报（工学版）》 EI CAS CSCD 北大核心 2013年第1期135-140,共6页; 针对E3算法所需的收敛时间界限太大,在实际问题中难以有效应用的问题,提出了一种基于多Agent并行采样和学习经验复用的改进算法。该算法在探索阶段,通过多Agent并行采样,快速收集模型信息,加速了模型构建过程;在利用阶段,通过保留最优... 展开更多; 关键词人工智能强化学习 E3算法多AGENT 并行采样学习经验复用; 下载PDF 职称材料

采用经验复用的高效强化学习控制方法被引量：1: 2; 作者郝钏钏方舟李平《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2012年第6期70-75,共6页; 使用定长情景进行学习的eNAC(episodic Natural Actor-Critic)算法是一种在理论上具有良好学习性能的强化学习控制算法,但其学习过程需要采样较多的定长情景,学习效率低.为此,文中提出了一种新的强化学习控制算法ER-eNAC.该算法在eNAC... 展开更多; 关键词强化学习自然策略梯度经验复用倒立摆控制; 下载PDF 职称材料

基于B-MAXQ自适应预测PID在柴油机调速中的研究被引量：2: 3; 作者惠小亮张朦朦 +2 位作者李鹏豪张永林曹钰《小型内燃机与车辆技术》 2020年第1期36-43,共8页; PID参数集合的选取直接影响齿条位置,从而控制柴油机的实际转速,所以要想使柴油机的实际转速无限趋近于所设定的目标转速,PID参数的选取至关重要。传统的PID控制技术大多使用的是固定公式调节,很难适应负载、模型参数大范围变化,并且很... 展开更多; 关键词电子调速器 PID MAXQ学习算法贝叶斯概率统计经验复用; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部