期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于SAC算法的移动机器人智能路径规划
被引量:
4
1
作者
杨来义
毕敬
苑海涛
《系统仿真学报》
CAS
CSCD
北大核心
2023年第8期1726-1736,共11页
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法。基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题。为使机器人快速...
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法。基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题。为使机器人快速躲避障碍物且到达目标,设计合理的奖励函数,使用动态的状态归一化和优先级经验技术。为评估该算法性能,构建基于Pygame的仿真环境。将所提算法与近端策略优化(proximal policy optimization,PPO)算法进行比较。实验结果表明:所提算法的累计奖励能够得到显著提高,并且具有更强的鲁棒性。
展开更多
关键词
深度强化学习
路径规划
SAC(soft
actor-critic)算法
连续奖励函数
移动机器人
下载PDF
职称材料
基于Soft-Actor-Critic算法的机器人局部路径规划算法
被引量:
4
2
作者
胡琴
赵一亭
+1 位作者
夏方平
张鹏
《武汉理工大学学报》
CAS
2021年第9期79-84,共6页
近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划...
近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划算法,以Soft-Actor-Critic(SAC)算法为框架,以实现机器人通过激光雷达获取的地图信息进行局部路径规划。首先,针对规划问题设计连续的状态-动作变量,并设计了一种连续的奖励函数,使得移动机器人每采取一个动作都可以获得相应的奖励,提高了训练效率,最后建立仿真环境,对智能体进行训练学习,结果验证了算法的有效性。
展开更多
关键词
移动机器人
深度强化学习
局部路径规划
连续奖励函数
原文传递
题名
基于SAC算法的移动机器人智能路径规划
被引量:
4
1
作者
杨来义
毕敬
苑海涛
机构
北京工业大学信息学部软件学院
北京航空航天大学自动化科学与电气工程学院
出处
《系统仿真学报》
CAS
CSCD
北大核心
2023年第8期1726-1736,共11页
基金
国家自然科学基金(62073005,62173013)。
文摘
为解决传统的机器人路径规划算法维度高、收敛慢、建模难等问题,提出一种新的路径规划算法。基于深度强化学习SAC(soft actor-critic)算法,旨在解决机器人面对具有静态和动态障碍物的复杂环境时,路径规划表现差的问题。为使机器人快速躲避障碍物且到达目标,设计合理的奖励函数,使用动态的状态归一化和优先级经验技术。为评估该算法性能,构建基于Pygame的仿真环境。将所提算法与近端策略优化(proximal policy optimization,PPO)算法进行比较。实验结果表明:所提算法的累计奖励能够得到显著提高,并且具有更强的鲁棒性。
关键词
深度强化学习
路径规划
SAC(soft
actor-critic)算法
连续奖励函数
移动机器人
Keywords
deep reinforcement learning
path planning
soft actor-critic algorithm
continuous reward functions
mobile robots
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Soft-Actor-Critic算法的机器人局部路径规划算法
被引量:
4
2
作者
胡琴
赵一亭
夏方平
张鹏
机构
武汉理工大学自动化学院
出处
《武汉理工大学学报》
CAS
2021年第9期79-84,共6页
基金
武汉理工大学国家级大学生创新创业训练计划(202010497076)。
文摘
近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划算法,以Soft-Actor-Critic(SAC)算法为框架,以实现机器人通过激光雷达获取的地图信息进行局部路径规划。首先,针对规划问题设计连续的状态-动作变量,并设计了一种连续的奖励函数,使得移动机器人每采取一个动作都可以获得相应的奖励,提高了训练效率,最后建立仿真环境,对智能体进行训练学习,结果验证了算法的有效性。
关键词
移动机器人
深度强化学习
局部路径规划
连续奖励函数
Keywords
mobile robot
deep reinforcement learning
local path planning
continuous reward function
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于SAC算法的移动机器人智能路径规划
杨来义
毕敬
苑海涛
《系统仿真学报》
CAS
CSCD
北大核心
2023
4
下载PDF
职称材料
2
基于Soft-Actor-Critic算法的机器人局部路径规划算法
胡琴
赵一亭
夏方平
张鹏
《武汉理工大学学报》
CAS
2021
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部