-
题名动态环境下分布式异构多机器人避障方法研究
被引量:5
- 1
-
-
作者
欧阳勇平
魏长赟
蔡帛良
-
机构
河海大学机电工程学院
英国卡迪夫大学工学院
-
出处
《智能系统学报》
CSCD
北大核心
2022年第4期752-763,共12页
-
基金
国家自然科学基金项目(61703138)
中央高校基本科研业务费项目(B200202224).
-
文摘
多机器人系统在联合搜救、智慧车间、智能交通等领域得到了日益广泛的应用。目前,多个机器人之间、机器人与动态环境之间的路径规划和导航避障仍需依赖精确的环境地图,给多机器人系统在非结构环境下的协调与协作带来了挑战。针对上述问题,本文提出了不依赖精确地图的分布式异构多机器人导航避障方法,建立了基于深度强化学习的多特征策略梯度优化算法,并考虑了人机协同环境下的社会范式,使分布式机器人能够通过与环境的试错交互,学习最优的导航避障策略;并在Gazebo仿真环境下进行了最优策略的训练学习,同时将模型移植到多个异构实体机器人上,将机器人控制信号解码,进行真实环境测试。实验结果表明:本文提出的多特征策略梯度优化算法能够通过自学习获得最优的导航避障策略,为分布式异构多机器人在动态环境下的应用提供了一种技术参考。
-
关键词
异构多机器人
深度强化学习
非结构环境
多特征策略梯度
动态避障
自学习
分布式控制
控制策略
-
Keywords
heterogeneous multi-robot systems
deep reinforcement learning
non-structural environment
multi-feature policy gradients
dynamic collision avoidance
self-learning
distributed control
control policy
-
分类号
TP273.2
[自动化与计算机技术—检测技术与自动化装置]
-