-
题名面向博弈对抗的多智能体强化学习建模与迁移技术
- 1
-
-
作者
李渊
刘运韬
徐新海
万珂嘉
-
机构
军事科学院
-
出处
《指挥与控制学报》
CSCD
北大核心
2024年第2期226-231,共6页
-
基金
国家自然科学基金(61902425)资助。
-
文摘
多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基于值分解的多智能体深度强化学习方法,为每个智能体独立构建网络模型,通过引入混合网络连接各个智能体,训练时以混合网络指导各智能体网络更新,执行时各智能体网络独立运行,实现集中式学习、分散式执行的训练模式。针对同构异构场景,设计一种高效的迁移训练技术,提升多智能体强化学习方法在不同场景下的快速训练效率。对同构和异构博弈对抗问题分别进行测试,实验结果表明基于值分解的多智能体强化学习方法和迁移技术,能够有效提升智能体的协作行为以及训练效率。
-
关键词
多智能体对抗博弈
深度强化学习
迁移学习
值分解
混合网络
训练效率
-
Keywords
multi-agent confrontation game
deep reinforcement learning
transfer learning
value decomposition
hybrid network
training efficiency
-
分类号
E86
[军事—战术学]
TP18
[自动化与计算机技术—控制理论与控制工程]
-