期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于SAC算法的移动机器人智能路径规划 被引量:4
1
作者 杨来义 毕敬 苑海涛 《系统仿真学报》 CAS CSCD 北大核心 2023年第8期1726-1736,共11页
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法。基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题。为使机器人快速... 为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法。基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题。为使机器人快速躲避障碍物且到达目标,设计合理的奖励函数,使用动态的状态归一化和优先级经验技术。为评估该算法性能,构建基于Pygame的仿真环境。将所提算法与近端策略优化(proximal policy optimization,PPO)算法进行比较。实验结果表明:所提算法的累计奖励能够得到显著提高,并且具有更强的鲁棒性。 展开更多
关键词 深度强化学习 路径规划 SAC(soft actor-critic)算法 连续奖励函数 移动机器人
下载PDF
基于Soft-Actor-Critic算法的机器人局部路径规划算法 被引量:4
2
作者 胡琴 赵一亭 +1 位作者 夏方平 张鹏 《武汉理工大学学报》 CAS 2021年第9期79-84,共6页
近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划... 近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划算法,以Soft-Actor-Critic(SAC)算法为框架,以实现机器人通过激光雷达获取的地图信息进行局部路径规划。首先,针对规划问题设计连续的状态-动作变量,并设计了一种连续的奖励函数,使得移动机器人每采取一个动作都可以获得相应的奖励,提高了训练效率,最后建立仿真环境,对智能体进行训练学习,结果验证了算法的有效性。 展开更多
关键词 移动机器人 深度强化学习 局部路径规划 连续奖励函数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部