期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的路径规划技术综述 被引量:42
1
作者 闫皎洁 张锲石 胡希平 《计算机工程》 CAS CSCD 北大核心 2021年第10期16-25,共10页
路径规划作为移动机器人自主导航的关键技术,主要是使目标对象在规定范围内找到一条从起点到终点的无碰撞安全路径。阐述基于常规方法和强化学习方法的路径规划技术,将强化学习方法主要分为基于值和基于策略两类,对比时序差分、Q-Learn... 路径规划作为移动机器人自主导航的关键技术,主要是使目标对象在规定范围内找到一条从起点到终点的无碰撞安全路径。阐述基于常规方法和强化学习方法的路径规划技术,将强化学习方法主要分为基于值和基于策略两类,对比时序差分、Q-Learning等基于值的代表方法与策略梯度、模仿学习等基于策略的代表方法,并分析其融合策略和深度强化学习方法方法的发展现状。在此基础上,总结各种强化学习方法的优缺点及适用场合,同时对基于强化学习的路径规划技术的未来发展方向进行展望。 展开更多
关键词 路径规划 强化学习 深度强化学习 移动机器人 自主导航
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部