期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于SPE-ICM的移动机器人内在动机避障规划 被引量:3
1
作者 罗国攀 张国良 徐佳宝 《电子测量与仪器学报》 CSCD 北大核心 2023年第2期21-27,共7页
针对动态环境下强化学习算法对移动障碍物的检测不理想,进而影响最优避障策略的问题。提出一种以状态预测误差为内在动机的奖励结构形式(state predict error-intrinsic curiosity module,SPE-ICM)来提高策略函数对Agent的环境探索能力... 针对动态环境下强化学习算法对移动障碍物的检测不理想,进而影响最优避障策略的问题。提出一种以状态预测误差为内在动机的奖励结构形式(state predict error-intrinsic curiosity module,SPE-ICM)来提高策略函数对Agent的环境探索能力。首先,引入内在奖励机制为Agent提供多重奖励(reward)结构;其次,依据内外的奖励结构优化提高Agent对环境信息的感知能力,改进对移动障碍物在数据结构上的采集检测方式,并且依赖新的检测方式对最优避障策略函数进行优化提升;最后,将该网络模型与深度确定性策略梯度算法(DDPG)结合,运用到以ROS搭建的路径规划仿真环境中进行对比实验,验证所提算法的可行性。结果表明,所提算法在检测能力、决策能力上效果明显更优。 展开更多
关键词 状态奖励误差 内在动机奖励 最优避障策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部