-
题名基于分层深度强化学习的移动机器人导航方法
被引量:9
- 1
-
-
作者
王童
李骜
宋海荦
刘伟
王明会
-
机构
中国科学技术大学信息科学技术学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2022年第11期2799-2807,共9页
-
基金
中国科学技术大学优秀引进人才基金项目(KY2100000021)
国家自然科学基金项目(61971393,61871361)。
-
文摘
针对现有基于深度强化学习(deep reinforcement learning,DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning,HDRL)的移动机器人导航方法.该方法的模型框架分为高层和低层两部分,其中低层的避障和目标驱动控制模型分别实现避障和目标接近两种行为策略,高层的行为选择模型可自动学习稳定、可靠的行为选择策略,从而有效避免对人为设计调控规则的依赖.此外,所提出方法通过对避障控制模型进行优化训练,使学习到的避障策略更加适用于复杂环境下的导航任务.在与现有DRL方法的对比实验中,所提出方法在全部仿真测试环境中均取得最高的导航成功率,同时在其他指标上也具有整体优势,表明所提出方法可有效解决复杂环境下导航效果不佳的问题,且具有较强的泛化能力.此外,真实环境下的测试进一步验证了所提出方法的潜在应用价值.
-
关键词
深度强化学习
分层深度强化学习
移动机器人
导航
避障
策略学习
-
Keywords
deep reinforcement learning
hierarchical deep reinforcement learning
mobile robot
navigation
obstacle avoidance
policy learning
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-