检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于后验经验回放的MAAC多智能体强化学习算法: 1; 作者夏琳罗威 +1 位作者王俊霞黄一学《软件》 2023年第2期17-22,41,共7页; [目的]针对多智能体强化学习过程中样本利用率低、奖励稀疏、收敛速度慢等问题,提出了一种基于后验经验回放的MAAC(Actor-Attention-Critic for Multi-Agent Reinforcement Learning,MAAC)多智能体强化学习(Hindsight Experience Replay... 展开更多; 关键词多智能体系统深度强化学习后验经验回放注意力机制; 下载PDF 职称材料

基于后验经验回放的MADDPG算法被引量：3: 2; 作者孙彧徐越 +3 位作者潘宣宏戴定成孙健陈新群《指挥信息系统与技术》 2021年第6期78-84,共7页; 训练效率过低和收敛速度过慢是多智能体深度强化学习(MDRL)领域一大问题。多智能体深度确定性策略梯度(MADDPG)作为经典算法已应用于多种仿真场景,但其原始的经验回放机制在样本存放和抽取方面效率较低。针对该问题,提出了基于后验经验... 展开更多; 关键词多智能体系统多智能体深度强化学习多智能体深度确定性策略梯度算法后验经验回放; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部