-
题名基于PPO的球形机器人目标跟随研究
- 1
-
-
作者
靳一聪
应展烽
刘春政
葛昊
陈志华
-
机构
南京理工大学瞬态物理国家重点实验室
南京理工大学能源与动力工程学院
-
出处
《兵器装备工程学报》
CAS
CSCD
北大核心
2024年第3期280-285,共6页
-
基金
江苏省自然资源厅科技计划项目(JSZRHKJ202219)。
-
文摘
球形机器人由于其优异的运动性能、出色的地形适应能力和防侧翻的特性,被广泛应用于水下探测、岸滩巡检等需要适应复杂环境的场景。然而球形机器人系统模型具有欠驱动、非线性的特点,运动控制问题复杂,在复杂应用环境下难以可靠跟随目标。为此,提出了一种基于近端策略优化(PPO)算法的球形机器人目标跟随方法。该方法基于深度强化学习理论,在球形机器人动力学模型的基础上,设计了简单高效的动作空间和表征完善的状态空间。并且为提高目标跟随方法的鲁棒性,该方法在奖励函数中引入人工势场,以使目标始终保持在机器人视野中心。仿真结果表明,所提方法能够满足既定场景的跟随需求,球形机器人使用该方法可以对随机运动目标进行可靠跟随。
-
关键词
球形机器人
目标跟随
强化学习
PPO算法
人工势场
-
Keywords
spherical robot
target following
deep reinforcement learning
PPO
artificial potential field
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-