期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
利用团队间的影响解决多智能体强化学习中的奖励冲突
1
作者 赵花蕊 《智能计算机与应用》 2024年第10期56-62,共7页
本文提出了一种基于智能体间相互作用的MARL学习框架,称为IC,以解决MARL中稀疏奖励环境导致智能体产生冲突的问题。IC的主要功能是根据智能体间的高斯核函数大小赋予不同的值,计算出智能体的影响矩阵,并将影响矩阵的核范数作为额外奖励... 本文提出了一种基于智能体间相互作用的MARL学习框架,称为IC,以解决MARL中稀疏奖励环境导致智能体产生冲突的问题。IC的主要功能是根据智能体间的高斯核函数大小赋予不同的值,计算出智能体的影响矩阵,并将影响矩阵的核范数作为额外奖励引入到目标函数中,以提高智能体探索性能以及团队之间的协作能力。实验结果表明,IC可以显著提高智能体间的协作能力,并在稀疏奖励环境中加速智能体对最优策略的学习。这是首次在MARL中尝试利用智能体之间的相互影响来促进智能体的探索能力。 展开更多
关键词 多智能体强化学习 稀疏奖励 奖励冲突 高斯核函数 核范数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部