基于Soft-Actor-Critic算法的机器人局部路径规划算法被引量：4

Robot Local Path Planning Algorithm Based on Soft-Actor-Critic Algorithm

导出

摘要近年来移动机器人应用逐渐广泛,以定位、路径规划等导航技术成为移动机器人研究的热点问题,随着移动机器人执行任务的环境复杂度逐渐增加,移动机器人通过与环境交互实时学习进行路径规划,成为新的研究趋势。作者提出了一种局部路径规划算法,以Soft-Actor-Critic(SAC)算法为框架,以实现机器人通过激光雷达获取的地图信息进行局部路径规划。首先,针对规划问题设计连续的状态-动作变量,并设计了一种连续的奖励函数,使得移动机器人每采取一个动作都可以获得相应的奖励,提高了训练效率,最后建立仿真环境,对智能体进行训练学习,结果验证了算法的有效性。 Mobile robot applications in recent years has been to localization,path planning for mobile robot navigation technology such as the hot issues of the study,along with the mobile robot to perform a task environment complexity increases gradually,mobile robot path planning,through the interaction with the environment in real time to study to become a new research trend,in this paper,we propose a framework for training Soft-Actor-Critic(SAC)algorithm,in order to realize the robot with a laser radar map information for local path planning,first for planning problems involving statevariable,and designed a kind of compensation function in a row,Finally,a simulation environment is established to train and learn the agent,and the results verify the effectiveness of the algorithm.

作者胡琴赵一亭夏方平张鹏 HU Qin;ZHAO Yi-ting;XIA Fang-ping;ZHANG Peng(School of Automation,Wuhan University of Technology,Wuhan 430070,China)

机构地区武汉理工大学自动化学院

出处《武汉理工大学学报》 CAS 2021年第9期79-84,共6页 Journal of Wuhan University of Technology

基金武汉理工大学国家级大学生创新创业训练计划(202010497076)。

关键词移动机器人深度强化学习局部路径规划连续奖励函数 mobile robot deep reinforcement learning local path planning continuous reward function

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1霍凤财,迟金,黄梓健,任璐,孙勤江,陈建玲.移动机器人路径规划算法综述[J].吉林大学学报（信息科学版）,2018,36(6):639-647. 被引量：149
2王孟和,杨帅,张彭涛,沈婕.基于Voronoi图的点群移位算法效率优化研究[J].南京师范大学学报（工程技术版）,2016,16(4):52-56. 被引量：2
3杜梅,顾国昌.基于栅格的自由区域连通网络的机器人路径规划方法[J].哈尔滨工程大学学报,1995,16(2):49-53. 被引量：2
4康亮,赵春霞,郭剑辉.基于模糊滚动RRT算法的移动机器人路径规划[J].南京理工大学学报,2010,34(5):642-648. 被引量：29
5张福海,李宁,袁儒鹏,付宜利.基于强化学习的机器人路径规划算法[J].华中科技大学学报（自然科学版）,2018,46(12):65-70. 被引量：49

二级参考文献21

1侯璇,武芳,刘芳,邓红艳.基于弹性力学思想的居民地点群目标位移模型[J].测绘科学,2005,30(2):44-47. 被引量：9
2高庆吉,于咏生,胡丹丹.基于改进A*算法的可行性路径搜索及优化[J].中国民航学院学报,2005,23(4):42-45. 被引量：15
3刘义,张宇.基于改进人工势场法的移动机器人局部路径规划的研究[J].现代机械,2006(6):48-49. 被引量：18
4王洲,张毅,杨锐敏.基于遗传算法的移动机器人路径规划[J].微计算机信息,2008,24(26):187-189. 被引量：10
5康亮,赵春霞,郭剑辉.未知环境下改进的基于RRT算法的移动机器人路径规划[J].模式识别与人工智能,2009,22(3):337-343. 被引量：50
6陈卫东,李宝霞,朱奇光.模糊控制在移动机器人路径规划中的应用[J].计算机工程与应用,2009,45(31):221-223. 被引量：14
7暴励,曾建潮.自适应搜索空间的混沌蜂群算法[J].计算机应用研究,2010,27(4):1330-1334. 被引量：46
8石铁峰.改进遗传算法在移动机器人路径规划中的应用[J].计算机仿真,2011,28(4):193-195. 被引量：25
9严浩,沈婕,朱伟.线光滑算法效率优化方法研究[J].南京师范大学学报（工程技术版）,2012,12(2):87-92. 被引量：2
10席裕庚.动态不确定环境下广义控制问题的预测控制[J].控制理论与应用,2000,17(5):665-670. 被引量：71

共引文献224

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：28
2赵明,郑泽宇,么庆丰,潘怡君,刘智.基于改进人工势场法的移动机器人路径规划方法[J].计算机应用研究,2020,37(S02):66-68. 被引量：32
3金翔,王天霖,于鹏垚,赵勇.基于值迭代网络的路径规划算法[J].华中科技大学学报（自然科学版）,2020,48(2):91-96. 被引量：1
4罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
5李芳娣,邓晓燕,吴伟铭,周依静,陈芯婷.移动机器人复杂角点定位和停车策略研究与实现[J].电子测量技术,2023,46(22):26-31.
6杨敏豪,张国良,李德胜.基于双向F-RRT^(*)算法的移动机器人路径规划[J].电子测量技术,2023,46(5):91-97. 被引量：1
7简雪萍.基于人工智能助力居家智慧养老模式设计研究[J].智能计算机与应用,2020,10(1):304-306. 被引量：13
8高双,柳春平,张瞳,陈坤.可行状态包络下欠驱动水面船全时可跟踪轨迹规划方法[J].船舶工程,2022,44(S01):459-466. 被引量：1
9孙俊岭.基于电子海图的智能潜水器路径规划研究[J].海洋工程,2011,29(4):135-140. 被引量：2
10徐娜,陈雄,孔庆生,韩建达.非完整约束下的机器人运动规划算法[J].机器人,2011,33(6):666-672. 被引量：47

同被引文献21

1陈三风,韩鑫,湛邵斌,卢鑫,林广明,陈熙.基于回归神经网络多机械臂运动控制研究[J].控制工程,2017,24(11):2211-2217. 被引量：10
2何柳柳,杨羊,李征,赵瑞莲.面向持续集成测试优化的强化学习奖励机制[J].软件学报,2019,30(5):1438-1449. 被引量：13
3LI Shuang,YAN Yanghui,REN Ju,ZHOU Yuezhi,ZHANG Yaoxue.A Sample-Efficient Actor-Critic Algorithm for Recommendation Diversification[J].Chinese Journal of Electronics,2020,29(1):89-96. 被引量：5
4吴伟,胡冰,胡峰.基于全双工的主动监听系统中合法通信速率最大化方法设计[J].南京邮电大学学报（自然科学版）,2020,40(2):48-53. 被引量：2
5殷昌盛,杨若鹏,朱巍,邹小飞,李峰.多智能体分层强化学习综述[J].智能系统学报,2020,15(4):646-655. 被引量：24
6王健宗,孔令炜,黄章成,肖京.图神经网络综述[J].计算机工程,2021,47(4):1-12. 被引量：29
7杨帆.基于B+树存储的AABB包围盒碰撞检测算法[J].计算机科学,2021,48(S01):331-333. 被引量：17
8Kai Zhu,Tao Zhang.Deep Reinforcement Learning Based Mobile Robot Navigation:A Review[J].Tsinghua Science and Technology,2021,26(5):674-691. 被引量：27
9张瀚,解明扬,张民,伍乃骐.融合DDPG算法的移动机器人路径规划研究[J].控制工程,2021,28(11):2136-2142. 被引量：9
10孙世光,兰旭光,张翰博,郑南宁.基于模型的机器人强化学习研究综述[J].模式识别与人工智能,2022,35(1):1-16. 被引量：5

引证文献4

1羊波,王琨,马祥祥,范彪,徐磊,闫浩.多智能体强化学习的机械臂运动控制决策研究[J].计算机工程与应用,2023,59(6):318-325. 被引量：7
2许宏鑫,吴志周,梁韵逸.基于强化学习的自动驾驶汽车路径规划方法研究综述[J].计算机应用研究,2023,40(11):3211-3217. 被引量：7
3王贤明,杨超群,邵晋梁,龚成龙,张恒.基于智能反射面辅助的无人机主动监听优化方法[J].无人系统技术,2024,7(1):106-114. 被引量：1
4杜海军,余粟.基于时空图注意力网络的服务机器人动态避障[J].计算机工程,2024,50(2):105-112.

二级引证文献15

1何联格,李天华,聂远航,妥吉英.一种基于DDPG算法的6轴机械臂控制研究[J].重庆理工大学学报（自然科学）,2023,37(9):134-140. 被引量：4
2冯今瑀,张魁星,张铁林,李延军.辅助视障出行融合障碍物检测的路径规划研究进展[J].计算机系统应用,2024,33(4):50-59.
3李忠伟,刘伟鹏,罗偲.基于轨迹引导的移动机器人导航策略优化算法[J].计算机应用研究,2024,41(5):1456-1461.
4高剑,何耀祯,陈依民,张元旭,杨旭博,李宇丰,张桢驰.水下航行器视觉控制技术综述[J].水下无人系统学报,2024,32(2):282-294. 被引量：1
5夏庆锋,许可儿,李明阳,胡凯,宋利鹏,宋志强,孙宁.强化学习中的注意力机制研究综述[J].计算机科学与探索,2024,18(6):1457-1475.
6李骞,唐堂,王叶群,王平禄,陈姣,石磊.可见光辅助无人机通信网络容量优化方法[J].无人系统技术,2024,7(3):28-39.
7李明阳,许可儿,宋志强,夏庆锋,周鹏.多智能体强化学习算法研究综述[J].计算机科学与探索,2024,18(8):1979-1997. 被引量：1
8王鑫,张捷,吕明.基于Unity3D的档案抓取机械臂仿真系统设计与实现[J].工业控制计算机,2024,37(8):83-85.
9杨鹏飞,赵坤,武林伟,刘培波.基于4阶Bézier曲线的路径平滑方法研究[J].中国电子科学研究院学报,2024,19(5):448-454.
10李珑,桓茜.基于单片机技术的机器人机械臂运动控制研究[J].自动化与仪器仪表,2024(8):243-246.

1周俊,何永强.农业机械导航路径规划研究进展[J].农业机械学报,2021,52(9):1-14. 被引量：49
2仲训昱,武东杰,陈登龙,庄明溪,吴汶鸿,彭侠夫.基于多模态感知与融合的无人车韧性导航系统[J].导航定位与授时,2021,8(6):1-12. 被引量：1
3许伦辉,林世城.基于分治思想的扫地机器人全覆盖路径规划算法研究[J].广西师范大学学报（自然科学版）,2021,39(6):54-62. 被引量：6
4包汉,祝海涛,刘迪.基于±3σ正态概率区间分族遗传蚁群算法的移动机器人路径规划[J].控制与决策,2021,36(12):2861-2870. 被引量：8
5李宝帅,叶春明.深度强化学习算法求解作业车间调度问题[J].计算机工程与应用,2021,57(23):248-254. 被引量：6
6方小乐,王庆贵.全球气候变化背景下增氮及降水变化对早春植物影响研究进展[J].世界生态学,2021,10(4):592-601.

武汉理工大学学报

2021年第9期

浏览历史

内容加载中请稍等...

基于Soft-Actor-Critic算法的机器人局部路径规划算法被引量：4

参考文献5

二级参考文献21

共引文献224

同被引文献21

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Soft-Actor-Critic算法的机器人局部路径规划算法 被引量：4

参考文献5

二级参考文献21

共引文献224

同被引文献21

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于Soft-Actor-Critic算法的机器人局部路径规划算法被引量：4