期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于注意力学习的多智能体路径规划协作策略
1
作者
马金超
连德富
《中国科学技术大学学报》
CAS
CSCD
北大核心
2023年第4期31-42,I0008,I0009,共14页
多智能体路径发现(MAPF)是一个具有挑战性和有意义的问题,其中要求所有智能体在不相互碰撞和避免障碍的情况下有效地达到其目标地点。在多智能体路径发现中,有效地提取和表达智能体的观察结果、有效地利用历史信息以及与相邻智能体之间...
多智能体路径发现(MAPF)是一个具有挑战性和有意义的问题,其中要求所有智能体在不相互碰撞和避免障碍的情况下有效地达到其目标地点。在多智能体路径发现中,有效地提取和表达智能体的观察结果、有效地利用历史信息以及与相邻智能体之间的有效通信是完成多智能体协作任务所面临的挑战。为了解决这些问题,本文提出了一个精心设计的模型,利用附近智能体的局部状态,并为每个智能体输出一个最优的执行动作。我们通过使用残差注意力卷积神经网络(residual attention CNN)来提取局部观测构建局部观测编码器,并使用Transformer架构来构建交互层来组合智能体的局部观测。为了提高该模型的成功率。我们还引入了一种新的指标,即额外时间比率(ETR)。实验结果表明,我们提出的模型在成功率和ETR方面优于以前的大多数模型。此外,我们还完成了对模型的消融研究,并证明了模型各组成部分的有效性。
展开更多
关键词
多智能体路径发现
强化学习
去中心化规划
注意机制
下载PDF
职称材料
题名
基于注意力学习的多智能体路径规划协作策略
1
作者
马金超
连德富
机构
中国科学技术大学计算机科学与技术学院
出处
《中国科学技术大学学报》
CAS
CSCD
北大核心
2023年第4期31-42,I0008,I0009,共14页
基金
supported by the Fundamental Research Funds for the Central Universities (WK2150110017)。
文摘
多智能体路径发现(MAPF)是一个具有挑战性和有意义的问题,其中要求所有智能体在不相互碰撞和避免障碍的情况下有效地达到其目标地点。在多智能体路径发现中,有效地提取和表达智能体的观察结果、有效地利用历史信息以及与相邻智能体之间的有效通信是完成多智能体协作任务所面临的挑战。为了解决这些问题,本文提出了一个精心设计的模型,利用附近智能体的局部状态,并为每个智能体输出一个最优的执行动作。我们通过使用残差注意力卷积神经网络(residual attention CNN)来提取局部观测构建局部观测编码器,并使用Transformer架构来构建交互层来组合智能体的局部观测。为了提高该模型的成功率。我们还引入了一种新的指标,即额外时间比率(ETR)。实验结果表明,我们提出的模型在成功率和ETR方面优于以前的大多数模型。此外,我们还完成了对模型的消融研究,并证明了模型各组成部分的有效性。
关键词
多智能体路径发现
强化学习
去中心化规划
注意机制
Keywords
multi-agent path finding(MAPF)
reinforcement learning
decentralized planning
attention mechanism
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于注意力学习的多智能体路径规划协作策略
马金超
连德富
《中国科学技术大学学报》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部