-
题名基于多智能体强化学习的月面极端区域协同探测方法
被引量:2
- 1
-
-
作者
张杨
颜鹏
谢旭东
白成超
-
机构
中国空间技术研究院
哈尔滨工业大学航天学院
-
出处
《载人航天》
CSCD
北大核心
2023年第1期78-87,共10页
-
基金
国家重大科技专项。
-
文摘
针对单个月球车难以高效鲁棒地探测月面极端区域的问题,提出了一种基于多智能体强化学习的月球车协同探测方法。首先,将探测区域进行离散化处理,并使用栅格地图表达探测信息及各月球车的位置信息,然后,使用深度神经网络对视觉图像信息、激光雷达信息以及栅格地图信息进行特征提取;之后,在多智能体强化学习的架构下学习月球车的协同探测策略,通过设计考虑探测时间、安全约束及通信约束的奖励函数,使月球车可以快速安全地对月面极端区域进行协同探测;最后,在Gazebo中搭建了月面仿真环境并进行了仿真验证。结果表明:所提出的方法具备较高的探测效率与较好的安全保障。
-
关键词
月球车
月面极端区域
协同探测
多智能体强化学习
-
Keywords
lunar rover
extreme lunar region
collaborative exploration
multi-agent reinforcement learning
-
分类号
V476.3
[航空宇航科学与技术—飞行器设计]
-