-
题名人群环境中基于深度强化学习的移动机器人避障算法
被引量:24
- 1
-
-
作者
孙立香
孙晓娴
刘成菊
靖文
-
机构
盐城工业职业技术学院智能制造学院
同济人工智能(苏州)研究院
同济大学电子与信息工程学院
-
出处
《信息与控制》
CSCD
北大核心
2022年第1期107-118,共12页
-
基金
国家重点研究开发计划(2016YFD0700905)
2020年江苏省产学研合作项目(BY2020338)
2020年江苏省大学生创新创业训练计划项目(202013752028Y)。
-
文摘
为了控制移动机器人在人群密集的复杂环境中高效友好地完成避障任务,本文提出了一种人群环境中基于深度强化学习的移动机器人避障算法。首先,针对深度强化学习算法中值函数网络学习能力不足的情况,基于行人交互(crowd interaction)对值函数网络做了改进,通过行人角度网格(angel pedestrian grid)对行人之间的交互信息进行提取,并通过注意力机制(attention mechanism)提取单个行人的时序特征,学习得到当前状态与历史轨迹状态的相对重要性以及对机器人避障策略的联合影响,为之后多层感知机的学习提供先验知识;其次,依据行人空间行为(human spatial behavior)设计强化学习的奖励函数,并对机器人角度变化过大的状态进行惩罚,实现了舒适避障的要求;最后,通过仿真实验验证了人群环境中基于深度强化学习的移动机器人避障算法在人群密集的复杂环境中的可行性与有效性。
-
关键词
深度强化学习
人机共融
行人空间行为
移动机器人避障
-
Keywords
deep reinforcement learning
human-robot integration
human spatial behavior
obstacle avoidance for mobile robot
-
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
-