期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向Ad-Hoc协作的局部观测重建方法
1
作者 陈皓 杨立昆 +1 位作者 尹奇跃 黄凯奇 《中国科学院大学学报(中英文)》 CSCD 北大核心 2024年第1期117-126,共10页
在多智能体强化学习的研究中,如何进行Ad-Hoc协作,也就是说如何适应种类和数量变化的队友,是一个关键问题。现有方法或者有很强的先验知识假设,或者使用硬编码的规则进行合作,缺乏通用性,无法泛化到更一般的Ad-Hoc协作场景。为解决该问... 在多智能体强化学习的研究中,如何进行Ad-Hoc协作,也就是说如何适应种类和数量变化的队友,是一个关键问题。现有方法或者有很强的先验知识假设,或者使用硬编码的规则进行合作,缺乏通用性,无法泛化到更一般的Ad-Hoc协作场景。为解决该问题,提出一种面向Ad-Hoc协作的局部观测重建算法,利用注意力机制和采样网络对局部观测进行重建,使得算法认识到并充分利用不同局面中的高维状态表征,实现了在Ad-Hoc协作场景下的零样本泛化。在星际争霸微操环境和Ad-Hoc协作场景上与代表性算法的性能进行对比与分析,验证了算法的有效性。 展开更多
关键词 多智能体 深度强化学习 信用分配 ad-hoc协作
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部