期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于值函数分解的多智能体深度强化学习方法研究综述
1
作者 高玉钊 聂一鸣 《计算机科学》 CSCD 北大核心 2024年第S01期22-30,共9页
多智能体深度强化学习方法是深度强化学习方法在多智能体问题上的扩展,其中基于值函数分解的多智能体深度强化学习方法取得了较好的表现效果,是目前研究和应用的热点。文中介绍了基于值函数分解的多智能体深度强化学习方法的主要原理和... 多智能体深度强化学习方法是深度强化学习方法在多智能体问题上的扩展,其中基于值函数分解的多智能体深度强化学习方法取得了较好的表现效果,是目前研究和应用的热点。文中介绍了基于值函数分解的多智能体深度强化学习方法的主要原理和框架;根据近期相关研究,总结出了提高混合网络拟合能力问题、提高收敛效果问题和提高算法可扩展性问题3个研究热点,从算法约束、环境复杂度、神经网络限制等方面分析了3个热点问题产生的原因;根据拟解决的问题和使用的方法对现有研究进行了分类梳理,总结了同类方法的共同点,分析了不同方法的优缺点;对基于值函数分解的多智能体深度强化学习方法在网络节点控制、无人编队控制两个热点领域的应用进行了阐述。 展开更多
关键词 多智能体深度强化学习 值函数分解 拟合能力 收敛效果 可扩展性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部