-
题名多智能体深度强化学习研究进展
- 1
-
-
作者
丁世飞
杜威
张健
郭丽丽
丁玲
-
机构
中国矿业大学计算机科学与技术学院
矿山数字化教育部工程研究中心(中国矿业大学)
天津大学智能与计算学部
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第7期1547-1567,共21页
-
基金
国家自然科学基金项目(No.62276265,No.61976216,No.62206297)资助.
-
文摘
深度强化学习(Deep Reinforcement Learning,DRL)在近年受到广泛的关注,并在各种领域取得显著的成功.由于现实环境通常包括多个与环境交互的智能体,多智能体深度强化学习(Multi-Agent Deep Reinforcement Learning,MADRL)获得蓬勃的发展,在各种复杂的序列决策任务上取得优异的表现.本文对多智能体深度强化学习的工作进展进行综述,主要内容分为三个部分.首先,我们回顾了几种常见的多智能体强化学习问题表示及其对应的合作、竞争和混合任务.其次,我们对目前的MADRL方法进行了全新的多维度的分类,并对不同类别的方法展开进一步介绍.其中,我们重点综述值函数分解方法,基于通信的MADRL方法以及基于图神经网络的MADRL方法.最后,我们研究了MADRL方法在现实场景中的主要应用.希望本文能够为即将进入这一快速发展领域的新研究人员和希望获得全方位了解并根据最新进展确定新方向的现有领域专家提供帮助.
-
关键词
多智能体深度强化学习
基于值函数
基于策略
通信学习
图神经网络
-
Keywords
multi-agent deep reinforcement learning
value-based
policy-based
communication learning
graph neural network
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-