一种基于深度强化学习的无人小车双层路径规划方法被引量：2

Bi-level Path Planning Method for Unmanned Vehicle Based on Deep Reinforcement Learning

下载PDF

导出

摘要随着智能无人小车的广泛应用,智能化导航、路径规划和避障技术成为了重要的研究内容。文中提出了基于无模型的DDPG和SAC深度强化学习算法,利用环境信息循迹至目标点,躲避静态与动态的障碍物并且使其普适于不同环境。通过全局规划和局部避障相结合的方式,该方法以更好的全局性与鲁棒性解决路径规划问题,以更好的动态性与泛化性解决避障问题,并缩短了迭代时间;在网络训练阶段结合PID和A~*等传统算法,提高了所提方法的收敛速度和稳定性。最后,在机器人操作系统ROS和仿真程序gazebo中设计了导航和避障等多种实验场景,仿真实验结果验证了所提出的兼顾问题全局性和动态性的方法具有可靠性,生成的路径和时间效率有所优化。 With the wide application of intelligent unmanned vehicles,intelligent navigation,path planning and obstacle avoidance technology have become important research contents.This paper proposes model-free deep reinforcement learning algorithms DDPG and SAC,which use environmental information to track to the target point,avoid static and dynamic obstacles,and can be generally suitable for different environments.Through the combination of global planning and local obstacle avoidance,it solves the path planning problem with better globality and robustness,solves the obstacle avoidance problem with better dynamicity and generalization,and shortens the iteration time.In the network training stage,PID,Aand other traditional algorithms are combined to improve the convergence speed and stability of the method.Finally,a variety of experimental scenarios such as navigation and obstacle avoidance are designed in the robot operating system ROS and the simulation program gazebo.Simulation results verify the reliability of the proposed approach,which takes the global and dynamic nature of the problem into account and optimizes the generated paths and time efficiency.

作者黄昱洲王立松秦小麟 HUANG Yuzhou;WANG Lisong;QIN Xiaolin(College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China)

机构地区南京航空航天大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2023年第1期194-204,共11页 Computer Science

基金国家自然科学基金(61728204)。

关键词无人小车避障路径规划深度强化学习 Unmanned vehicle Obstacle avoidance Path planning Deep reinforcement learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1张辉,王耀南,易俊飞,钟杭,刘理,缪志强,江一鸣.面向重大疫情应急防控的智能机器人系统研究[J].中国科学：信息科学,2020,50(7):1069-1090. 被引量：29

二级参考文献9

1尤肖虎,潘志文,高西奇,曹淑敏,邬贺铨.5G移动通信发展趋势与若干关键技术[J].中国科学：信息科学,2014,44(5):551-563. 被引量：722
2尤肖虎,张川,谈晓思,金石,邬贺铨.基于AI的5G技术——研究方向与范例[J].中国科学：信息科学,2018,48(12):1589-1602. 被引量：65
3侯增广,赵新刚,程龙,王启宁,王卫群.康复机器人与智能辅助系统的研究进展[J].自动化学报,2016,42(12):1765-1779. 被引量：117
4丁文东,徐德,刘希龙,张大朋,陈天.移动机器人视觉里程计综述[J].自动化学报,2018,44(3):385-400. 被引量：46
5范俊君,田丰,杜一,刘正捷,戴国忠.智能时代人机交互的一些思考[J].中国科学：信息科学,2018,48(4):361-375. 被引量：78
6曹风魁,庄严,闫飞,杨奇峰,王伟.移动机器人长期自主环境适应研究进展和展望[J].自动化学报,2020,46(2):205-221. 被引量：36
7Manli Wang,Ruiyuan Cao,Leike Zhang,Xinglou Yang,Jia Liu,Mingyue Xu,Zhengli Shi,Zhihong Hu,Wu Zhong,Gengfu Xiao.Remdesivir and chloroquine effectively inhibit the recently emerged novel coronavirus (2019-nCoV) in vitro[J].Cell Research,2020,30(3):269-271. 被引量：605
8马艳阳,叶梓豪,刘坤华,陈龙.基于事件相机的定位与建图算法:综述[J].自动化学报,2021,47(7):1484-1494. 被引量：13
9赵亚军,郁光辉,徐汉青.6G移动通信网络:愿景、挑战与关键技术[J].中国科学：信息科学,2019,0(8):963-987. 被引量：179

共引文献28

1任工昌,尚亚东,刘朋,胡小龙.一种拖车式医用配送机器人的设计与实现[J].计算机时代,2021(1):41-45. 被引量：4
2郭迟,王梦媛,高柯夫,刘经南,左文炜.面向重大公共卫生事件的位置服务技术——以COVID-19疫情为例[J].武汉大学学报（信息科学版）,2021,46(2):150-158. 被引量：14
3易俊飞,张辉,赵晨阳,车爱博,王耀南.医药智能制造生产线关键技术研究进展[J].中南大学学报（自然科学版）,2021,52(2):421-433. 被引量：4
4雷涛,李钊,朱明明,路国华.一种适用于人群的快速智能雾化消毒装置的设计[J].中国医疗设备,2021,36(6):23-25. 被引量：4
5宋倩倩,李晓彤.移动式医疗服务机器人系统设计[J].电子制作,2021,29(16):33-35. 被引量：2
6胡寅,梅月兰.云到端一体化公共通道消毒防疫系统设计与应用[J].工业控制计算机,2021,34(9):99-102. 被引量：7
7宋薇,高原,沈林勇,章亚男.一种基于近场子集划分的多机器人任务分配算法[J].机器人,2021,43(5):629-640. 被引量：5
8杨善林,丁帅,顾东晓,李霄剑,欧阳波,齐佳音.医联网:新时代医疗健康模式变革与创新发展[J].管理科学学报,2021,24(10):1-11. 被引量：27
9崔少晨.车厢门把手的自动化消毒装置设计[J].微型电脑应用,2022,38(2):87-90.
10班明莉,王运斗,高树田,田瑾.从新冠肺炎疫情看重大传染病疫情现场防控装备新发展[J].中国急救复苏与灾害医学杂志,2022,17(2):247-251. 被引量：3

同被引文献34

1李了了,邓善熙,丁兴号.基于大津法的图像分块二值化算法[J].微计算机信息,2005,21(08X):76-77. 被引量：113
2王丁磊,冯冬青.基于模糊控制的PID参数的整定[J].安阳工学院学报,2006,5(1):15-18. 被引量：7
3鲁雄文.模糊PID控制系统的设计与研究[J].现代电子技术,2014,37(24):146-149. 被引量：16
4田辉,范绍帅,吕昕晨,赵鹏涛,贺硕.面向5G需求的移动边缘计算[J].北京邮电大学学报,2017,40(2):1-10. 被引量：84
5CHEN Yimin,LU Rongron,ZOU Yibo,ZHANG Yanhui.Branch-Activated Multi-Domain Convolutional Neural Network for Visual Tracking[J].Journal of Shanghai Jiaotong university(Science),2018,23(3):360-367. 被引量：2
6谢人超,廉晓飞,贾庆民,黄韬,刘韵洁.移动边缘计算卸载技术综述[J].通信学报,2018,39(11):138-155. 被引量：124
7吕华章,陈丹,范斌,王友祥,乌云霄.边缘计算标准化进展与案例分析[J].计算机研究与发展,2018,55(3):487-511. 被引量：87
8葛畅,白光伟,沈航,宋来将.基于边缘计算的视频监控框架[J].计算机工程与设计,2019,40(1):32-39. 被引量：22
9郭剑岚,陈俞强.基于Stackelberg博弈的车载云计算任务卸载优化[J].计算机应用研究,2019,36(12):3752-3755. 被引量：4
10吴迪.边缘计算赋能智慧城市:机遇与挑战[J].学术前沿,2020(9):18-25. 被引量：10

引证文献2

1何牧,孙越,庞琦方.基于边缘计算的智能视频分析算法研究[J].电力大数据,2023,26(4):65-73.
2吴子豪,颜斌,陈龙.基于图像识别的三轮智能车自动控制系统设计[J].电子制作,2024,32(2):19-23.

1智宝岩.矿区井下无人运载车辆全局约束下的局部路径规划方法[J].中国设备工程,2022(24):141-142. 被引量：1
2宋安然,张细政,崔子健,杨明昊,方偲忱,卢张宇,王泽宇.基于模型预测控制的智能网联车辆主动避障方法[J].湖南工程学院学报（自然科学版）,2022,32(4):41-46. 被引量：1
3夏丽.高中物理实验探究课的线上教学探索——以“探究单摆的周期公式”为例[J].物理教学,2022,44(11):28-30. 被引量：5
4张程.基于专利分析的起重机智能避障技术相关态势研究[J].科技与创新,2023(1):71-73. 被引量：1
5李世军,任怀伟,张德生,马梓焱,周杰,赵叔吉,杜明.煤矿巷道冲尘机器人关键技术研究[J].工矿自动化,2022,48(12):86-92. 被引量：5
6范力元,张浩哲,徐钊,吕明伟,胡劲文,赵春晖,刘晓斌.基于安全飞行走廊的无人机密集障碍规避算法[J].西北工业大学学报,2022,40(6):1288-1296. 被引量：2
7和媛,张烨,王梦琛,崔斌,李延,樊海明.金属β-内酰胺酶L1的制备和动力学表征线上线下混合实验[J].大学化学,2022,37(12):203-209. 被引量：1

计算机科学

2023年第1期

浏览历史

内容加载中请稍等...

一种基于深度强化学习的无人小车双层路径规划方法被引量：2

参考文献1

二级参考文献9

共引文献28

同被引文献34

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的无人小车双层路径规划方法 被引量：2

参考文献1

二级参考文献9

共引文献28

同被引文献34

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的无人小车双层路径规划方法被引量：2