-
题名基于SPE-ICM的移动机器人内在动机避障规划
被引量:3
- 1
-
-
作者
罗国攀
张国良
徐佳宝
-
机构
四川轻化工大学人工智能四川省重点实验室
-
出处
《电子测量与仪器学报》
CSCD
北大核心
2023年第2期21-27,共7页
-
基金
四川省应用基础研究项目(2019YJ00413)资助
-
文摘
针对动态环境下强化学习算法对移动障碍物的检测不理想,进而影响最优避障策略的问题。提出一种以状态预测误差为内在动机的奖励结构形式(state predict error-intrinsic curiosity module,SPE-ICM)来提高策略函数对Agent的环境探索能力。首先,引入内在奖励机制为Agent提供多重奖励(reward)结构;其次,依据内外的奖励结构优化提高Agent对环境信息的感知能力,改进对移动障碍物在数据结构上的采集检测方式,并且依赖新的检测方式对最优避障策略函数进行优化提升;最后,将该网络模型与深度确定性策略梯度算法(DDPG)结合,运用到以ROS搭建的路径规划仿真环境中进行对比实验,验证所提算法的可行性。结果表明,所提算法在检测能力、决策能力上效果明显更优。
-
关键词
状态奖励误差
内在动机奖励
最优避障策略
-
Keywords
status reward error
optimal obstacle avoidance strategy
intrinsic motivation rewards
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-