基于强化学习的机器人路径规划算法被引量：46

Robot path planning algorithm based on reinforcement learning

导出

摘要提出了一种基于强化学习的机器人路径规划算法,该算法将激光雷达所获取的移动机器人周围障碍物信息与目标点所在方位信息离散成有限个状态,进而合理地设计环境模型与状态空间数目;设计了一种连续的报酬函数,使得机器人采取的每一个动作都能获得相应的报酬,提高了算法训练效率.最后在Gazebo中建立仿真环境,对该智能体进行学习训练,训练结果验证了算法的有效性;同时在实际机器人上进行导航实验,实验结果表明该算法在实际环境中也能够完成导航任务. A path planning algorithm for mobile robot was studied based on reinforcement learning.The algorithm discretized the obstacle information around the mobile robot acquired by the LIDAR(laser intensity direction and ranging)and the position information of the target point into finite state,and then rationally designed the number of the environmental model and state spaces.In addition,a continuous reward function was studied,which made each action taken by the robot get corresponding reward and improved the efficiency of algorithm training.Finally,a simulation environment was established in Gazebo to learn and train the agent.The training results verify the effectiveness of the algorithm.Simultaneously,a navigation experiment was conducted on an actual robot.The results show that the algorithm can also complete the navigation task in the actual environment.

作者张福海李宁袁儒鹏付宜利 Zhang Fuhai;Li Ning;Yuan Rupeng;Fu Yili(The State Key Laboratory of Robotics and System,Harbin Institute of Technology,Harbin 150001,China)

机构地区哈尔滨工业大学机器人技术与系统国家重点实验室

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2018年第12期65-70,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金黑龙江省自然科学基金资助项目(LC2017022)

关键词移动机器人强化学习路径规划连续报酬函数导航实验 mobile robot reinforcement learning path planning continuous reward function navigation experiment

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

同被引文献384

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：27
2李卫硕,孙剑,陈伟.基于BP神经网络机器人实时避障算法[J].仪器仪表学报,2019,40(11):204-211. 被引量：38
3蔺一帅,李青山,陆鹏浩,孙雨楠,王亮,王颖芝.智能仓储货位规划与AGV路径规划协同优化算法[J].软件学报,2020,31(9):2770-2784. 被引量：26
4王怀江,刘晓平,王刚,韩松.基于改进遗传算法的移动机械臂拣选路径优化[J].北京邮电大学学报,2020(5):34-40. 被引量：21
5张继仁,陈慧,宋绍禹,胡峰伟.基于强化学习的自动泊车运动规划[J].同济大学学报（自然科学版）,2019,47(S01):186-190. 被引量：3
6夏华夏.无人驾驶在末端物流配送中的应用和挑战[J].电子科学技术,2018,0(6):78-87. 被引量：6
7乔俊飞,侯占军,阮晓钢.基于神经网络的强化学习在避障中的应用[J].清华大学学报（自然科学版）,2008,48(S2):1747-1750. 被引量：27
8NAN Rendong.Five hundred meter aperture spherical radio telescope (FAST)[J].Science China(Physics,Mechanics & Astronomy),2006,49(2):129-148. 被引量：81
9帅高山,陈焕杰,柳占新.信息化战争下反水雷技术发展趋势与对策[J].水雷战与舰船防护,2014,22(1):1-6. 被引量：10
10王芳,万磊,徐玉如,张玉奎.基于改进人工势场的水下机器人路径规划[J].华中科技大学学报（自然科学版）,2011,39(S2):184-187. 被引量：15

引证文献46

1金翔,王天霖,于鹏垚,赵勇.基于值迭代网络的路径规划算法[J].华中科技大学学报（自然科学版）,2020,48(2):91-96. 被引量：1
2高双,柳春平,张瞳,陈坤.可行状态包络下欠驱动水面船全时可跟踪轨迹规划方法[J].船舶工程,2022,44(S01):459-466.
3李凤玲,陈珊,范兴江,刘源.基于萤火虫算法动态未知环境的路径规划[J].自动化与仪表,2019,34(6):53-58. 被引量：9
4朱泽凡,曾碧.基于多线激光雷达的无人车路径规划算法[J].机电工程技术,2019,48(5):11-14. 被引量：4
5季野彪,牛龙辉.基于模拟退火策略的强化学习路径规划算法[J].现代计算机,2019,0(32):12-16. 被引量：5
6封佳祥,江坤颐,周彬,袁志豪.多任务约束条件下基于强化学习的水面无人艇路径规划算法[J].舰船科学技术,2019,41(23):140-146. 被引量：6
7邝先验,欧阳鹏,周亚龙,罗会超.基于多层VSA-Morphin算法的局部路径规划[J].电子测量与仪器学报,2020,32(2):123-129. 被引量：1
8张栩源,李军.自动驾驶汽车路径规划技术[J].汽车工程师,2020(5):35-39. 被引量：3
9陈双,李龙,罗海南.基于神经网络的强化学习在服务机器人导航中的研究[J].现代计算机,2020,26(12):62-67.
10吴昭欣,李辉,王壮,陶伟,吴昊霖,侯贤乐.基于深度强化学习的智能仿真平台设计[J].战术导弹技术,2020(4):193-200. 被引量：6

二级引证文献191

1易俊,秦晓萌,岑颖珊,刘碧旺,韩定安,王茗祎,周月霞.GPU并行计算在FD-OCT成像中加速插值计算的应用[J].仪器仪表用户,2019,26(9):40-44. 被引量：1
2许德刚,赵萍.蝙蝠算法研究及应用综述[J].计算机工程与应用,2019,55(15):1-12. 被引量：32
3马丽萍,吴丹丹,姚鑫,李珣.基于微分进化算法的室内移动机器人路径规划[J].西安工程大学学报,2020,34(1):78-84. 被引量：7
4刘丹彤,杜志达.基于IBA-RBF的水电站厂房结构振动响应预测[J].中国农村水利水电,2020(8):249-253. 被引量：4
5孙培豪.陆军弹药转运路径多目标动态规划方法仿真[J].计算机仿真,2020,37(11):1-4.
6郭银景,孟庆良,孔芳,吕文红.AUV路径规划算法研究现状与展望[J].计算机科学与探索,2020,14(12):1981-1994. 被引量：26
7焦进,迟小羽,赖秋,杨子力,储园,杨坤莲,杨锐.应用于增强现实变电运检三维场景重建的增量八叉树算法[J].应用科技,2020,47(5):58-63. 被引量：4
8余星宝,杨慧斌,周玉凤,闫健.改进A^*的4阶贝塞尔曲线路径规划[J].轻工机械,2020,38(6):64-67. 被引量：8
9杜卓颖,李金禧,张祥来,朱琳.基于改进Q学习的“货到人”拣选系统AGV路径规划[J].物流技术,2020,39(12):88-92.
10李鹏,赵鲁燕.激光雷达测距的机器人最优移动路径选择机制[J].激光杂志,2021,42(1):183-186. 被引量：5

1韦鉴峰,吕恩利,王飞仁,林伟加,阮清松.温室环境监测机器人路径跟踪算法与试验[J].农机化研究,2019,41(8):7-14. 被引量：3
2姜坤.提升高中体育特长生训练效率的方法初探[J].体育风尚,2019(1):35-35. 被引量：2
3许翔.目标导向体系在高校田径教学训练中的有效应用[J].体育风尚,2018(11):44-44.
4唐世文,洪洲.基于蚁群算法的机器人路径规划研究[J].机电信息,2019(8):46-47. 被引量：2
5丁锦钰.基于神经网络和强化学习的西洋跳棋评估算法[J].电子制作,2019,27(4):45-46.
6张理月,余巧玲,郑智勇.福建省竞技跆拳道开展现状及对策研究[J].福建体育科技,2019,38(1):19-22. 被引量：1
7曹其新,黄先群,朱笑笑,邹风山.基于保留区域的分布式多机器人路径规划[J].华中科技大学学报（自然科学版）,2018,46(12):71-76. 被引量：12
8金涛斌,刘正文,刘俊岭,焦向东.MOTOMAN机器人MIG焊快速成型中的控制方法研究[J].机械工程与自动化,2019(1):160-162. 被引量：1
9林骏驰.小组合作训练在职教体育教学中的应用[J].新智慧,2018(12):47-47.
10汪盛民,林伟,曾碧.未知环境下基于虚拟子目标的对立Q学习机器人路径规划[J].广东工业大学学报,2019,36(1):51-56. 被引量：4

华中科技大学学报（自然科学版）

2018年第12期

浏览历史

内容加载中请稍等...

基于强化学习的机器人路径规划算法被引量：46

同被引文献384

引证文献46

二级引证文献191

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机器人路径规划算法 被引量：46

同被引文献384

引证文献46

二级引证文献191

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机器人路径规划算法被引量：46