期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于角色分类的多智能体经验共享重放方法研究
1
作者
赵星懋
李智
《产业科技创新》
2022年第2期22-23,共2页
近年来多智能体强化学习发展迅猛,解决了许多序列决策问题。针对多智能体强化学习合作场景下,智能体联合动作状态空间搜索困难、经验数据利用效率低、价值函数收敛缓慢等问题,提出了全新的基于角色分类的优先经验重放共享RC-PSER(Role C...
近年来多智能体强化学习发展迅猛,解决了许多序列决策问题。针对多智能体强化学习合作场景下,智能体联合动作状态空间搜索困难、经验数据利用效率低、价值函数收敛缓慢等问题,提出了全新的基于角色分类的优先经验重放共享RC-PSER(Role Classification Prioritized Shared Experience Replay)方法。RC-PSER主要有两个优势:一是通过优先经验重放方法提取高价值的数据供网络学习;二是通过基于角色分类的经验共享,将各个智能体采取的动作表征聚类后对智能体角色进行划分。实验表明,RC-PSER方法比主流的经验重放[1][2]机制包括UER(Uniform Experience Replay)、PER(Prioritized Experience Replay)、PSER(Prioritized Shared Experience Replay)与值函数分解的深度强化学习算法结合后表现得更好。
展开更多
关键词
多智能体强化学习
优先经验共享重放
值函数分解
经验分享
下载PDF
职称材料
题名
基于角色分类的多智能体经验共享重放方法研究
1
作者
赵星懋
李智
机构
四川大学
出处
《产业科技创新》
2022年第2期22-23,共2页
文摘
近年来多智能体强化学习发展迅猛,解决了许多序列决策问题。针对多智能体强化学习合作场景下,智能体联合动作状态空间搜索困难、经验数据利用效率低、价值函数收敛缓慢等问题,提出了全新的基于角色分类的优先经验重放共享RC-PSER(Role Classification Prioritized Shared Experience Replay)方法。RC-PSER主要有两个优势:一是通过优先经验重放方法提取高价值的数据供网络学习;二是通过基于角色分类的经验共享,将各个智能体采取的动作表征聚类后对智能体角色进行划分。实验表明,RC-PSER方法比主流的经验重放[1][2]机制包括UER(Uniform Experience Replay)、PER(Prioritized Experience Replay)、PSER(Prioritized Shared Experience Replay)与值函数分解的深度强化学习算法结合后表现得更好。
关键词
多智能体强化学习
优先经验共享重放
值函数分解
经验分享
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于角色分类的多智能体经验共享重放方法研究
赵星懋
李智
《产业科技创新》
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部