期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向博弈对抗的多智能体强化学习建模与迁移技术
1
作者 李渊 刘运韬 +1 位作者 徐新海 万珂嘉 《指挥与控制学报》 CSCD 北大核心 2024年第2期226-231,共6页
多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基... 多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基于值分解的多智能体深度强化学习方法,为每个智能体独立构建网络模型,通过引入混合网络连接各个智能体,训练时以混合网络指导各智能体网络更新,执行时各智能体网络独立运行,实现集中式学习、分散式执行的训练模式。针对同构异构场景,设计一种高效的迁移训练技术,提升多智能体强化学习方法在不同场景下的快速训练效率。对同构和异构博弈对抗问题分别进行测试,实验结果表明基于值分解的多智能体强化学习方法和迁移技术,能够有效提升智能体的协作行为以及训练效率。 展开更多
关键词 多智能体对抗博弈 深度强化学习 迁移学习 值分解 混合网络 训练效率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部