基于改进DDQN的无人车路径规划算法

An Improved DDQN Path Planning Algorithm for Unmanned Vehicle

下载PDF

导出

摘要针对DDQN算法在路径规划方面存在收敛速度慢和路径质量低等问题,基于DDQN算法研究了一种无人车路径规划算法。首先,通过获得多个时刻的奖励值,将这些奖励累加并均值处理从而充分利用奖励值信息;然后,通过优化斥力生成的方向改进人工势场法,并用改进的人工势场法代替随机探索提升收敛速度;最后,通过判断路径与障碍物的关系移除冗余节点,并使用贝塞尔曲线对路径进行平滑处理提升路径质量。仿真结果表明,在20×20的两种环境中,改进的DDQN算法相比原始DDQN算法收敛速度分别提升69.01%和55.88%,路径长度分别缩短21.39%和14.33%,并且路径平滑度更高。将改进的DDQN算法部署在无人车上进行检验,结果表明无人车能够较好完成路径规划任务。 Aiming at the problems of slow convergence speed and low path quality in the DDQN algorithm,a path planning algorithm for unmanned vehicles based on DDQN was studied.First,the reward value information is made full use of by obtaining the reward values at a plurality of times,accumulating the rewards,and averaging the rewards.Then,the artificial potential field method is improved by optimizing the direction of repulsion generation,and the improved artificial potential field method is used to replace the random exploration to improve the convergence rate.Finally,the redundant nodes are removed by judging the relationship between the path and obstacles,and the Bessel curve is used to smooth the path to improve the quality of the path.Simulation results show that the convergence rate of the improved DDQN algorithm is improved by 69.01%and 55.88%,and the path length is shortened by 21.39%and 14.33%,respectively,compared with the original DDQN in the two environments of 20×20,and the path smoothness is higher.The improved DDQN algorithm is deployed on the unmanned vehicle to test,and the results show that the unmanned vehicle can complete the path planning task well.

作者曹京威何秋生 CAO Jingwei;HE Qiusheng(School of Electronic Information Engineering,Taiyuan University of Science and Technology,Taiyuan 030024,China)

机构地区太原科技大学电子信息工程学院

出处《组合机床与自动化加工技术》北大核心 2024年第8期48-53,共6页 Modular Machine Tool & Automatic Manufacturing Technique

基金山西省自然科学研究面上项目(20210302123222) 山西省研究生科研创新项目(2023KY648)。

关键词强化学习深度Q网络人工势场路径规划 reinforcement learning deep Q-network artificial potential field path planning

分类号 TH162 [机械工程—机械制造及自动化] TG659 [金属学及工艺—金属切削加工及机床]

引文网络
相关文献

参考文献10

1李晓旭,马兴录,王先鹏.移动机器人路径规划算法综述[J].计算机测量与控制,2022,30(7):9-19. 被引量：43
2王鹤静,王丽娜.机器人路径规划算法综述[J].桂林理工大学学报,2023,43(1):137-147. 被引量：15
3孙小倩,辛绍杰.基于改进型A^(*)算法的移动机器人路径规划[J].组合机床与自动化加工技术,2023(3):5-8. 被引量：7
4尚正阳,顾寄南,王建平.求解带能力约束车辆路径优化问题的改进模拟退火算法[J].计算机集成制造系统,2021,27(8):2260-2269. 被引量：20
5李朝迁,裴建朝.新型模拟退火遗传算法在路径优化的应用[J].组合机床与自动化加工技术,2022(3):52-55. 被引量：11
6郭一聪,刘小雄,章卫国,杨跃.基于改进势场法的无人机三维路径规划方法[J].西北工业大学学报,2020,38(5):977-986. 被引量：43
7向金林,王鸿东,欧阳子路,易宏.基于改进双向RRT的无人艇局部路径规划算法研究[J].中国造船,2020,61(1):157-166. 被引量：16
8白晓兰,周文全,张振朋,袁铮.基于启发式粒子群算法的机器人平滑路径规划[J].组合机床与自动化加工技术,2022(8):44-47. 被引量：5
9徐玉琼,娄柯,李志锟.基于变步长蚁群算法的移动机器人路径规划[J].智能系统学报,2021,16(2):330-337. 被引量：15
10唐振韬,邵坤,赵冬斌,朱圆恒.深度强化学习进展:从AlphaGo到AlphaGo Zero[J].控制理论与应用,2017,34(12):1529-1546. 被引量：90

二级参考文献142

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：25
2谢聪.求解TSP问题的改进离散蝴蝶优化算法[J].数学的实践与认识,2020,0(1):173-182. 被引量：7
3许松清,吴海彬,林宜,高洪张,陈天炎.基于Voronoi图法的移动机器人路径规划[J].中国工程机械学报,2005,3(3):336-340. 被引量：12
4孙波,陈卫东,席裕庚.基于粒子群优化算法的移动机器人全局路径规划[J].控制与决策,2005,20(9):1052-1055. 被引量：79
5宋晖,高小明,张华.智能机器人路径规划及算法研究[J].微计算机信息,2006(11Z):244-246. 被引量：14
6刘义,张宇.基于改进人工势场法的移动机器人局部路径规划的研究[J].现代机械,2006(6):48-49. 被引量：17
7刘玲,王耀南,况菲,张辉.基于神经网络和遗传算法的移动机器人路径规划[J].计算机应用研究,2007,24(2):264-265. 被引量：22
8王宏健,伍祥红,施小成.基于蚁群算法的AUV全局路径规划方法[J].中国造船,2008,49(2):88-93. 被引量：15
9王娟娟,曹凯.基于栅格法的机器人路径规划[J].农业装备与车辆工程,2009,47(4):14-17. 被引量：30
10王银年,葛洪伟.求解TSP问题的改进模拟退火遗传算法[J].计算机工程与应用,2010,46(5):44-47. 被引量：32

共引文献253

1陈谦,陈国良.对低空飞行无人机不确定威胁的规避策略研究[J].数字制造科学,2023(2):120-125.
2姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：15
3贠鹏举,马平,赵俊达,刘涛.运输巷智能自移无轨设备列车多变量模糊牵引控制研究[J].煤炭工程,2022,54(S01):137-142. 被引量：1
4卢喜丰,王新军,白晓明,何风,吕勇波,李柄锦.基于BP神经网络和遗传算法的核级管道力学性能优化研究[J].科技视界,2023(16):138-144.
5高佳明,张丽,蒋梅.个税改革下资源型省份家庭金融资产投资决策研究[J].金融发展评论,2024(3):80-95.
6段会龙,武炎明,刘金国.改进型A^(*)算法的可重构机器人路径规划研究[J].电子测量技术,2023,46(6):44-50. 被引量：1
7高志强,张荣荣.面向战术边缘的联合智能体系设计[J].火箭军工程大学学报,2021(3):19-23.
8庄宝玲,陈文列.偶发分枝杆菌的超微结构初步观察[J].福建医药杂志,2000,22(1):181-182. 被引量：2
9程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：118
10朱斐,吴文,刘全,伏玉琛.一种最大置信上界经验采样的深度Q网络方法[J].计算机研究与发展,2018,55(8):1694-1705. 被引量：13

1洪道玉,陈巍,陈国军,杨雪,郭铁铮.融合人工势场和RRT算法的水下机械臂自适应路径规划[J].农业装备与车辆工程,2024,62(8):99-103.
2张家维,白成超,郭继峰.考虑基座振动抑制的双空间机械臂协同阻抗控制[J].宇航学报,2024,45(7):1111-1122.
3方立平,陈远明,杨哲,谭德坤.基于改进TD3算法的机器人路径规划[J].齐鲁工业大学学报,2024,38(4):1-9.
4王栋,张军,邹看看.基于ROS的自主导航消毒服务机器人研究[J].哈尔滨商业大学学报（自然科学版）,2024,40(4):397-403.
5高毅,宋月亭,杨克光.基于Android的动态折线图组件设计[J].现代计算机,2024,30(12):110-113.
6刘明阳,张震,宋婷婷,周维庆.一种基于策略迁移和强化学习的AMR路径规划方法[J].控制工程,2024,31(7):1195-1202.
7丁明解,高键,常红杰,俞朝春,顾加烨,齐亮.基于模糊自适应反步算法的多电机同步控制[J].计算机与数字工程,2024,52(4):978-983.
8马兰.产品营销网络提质升级路径研究——以A烟草公司为例[J].企业改革与管理,2024(13):41-43.
9朱波,姜官武,王旭亮,王旭.基于改进RRT-Connect算法的移动机器人路径规划[J].组合机床与自动化加工技术,2024(8):33-37.
10邝湘宁,邱法聚,徐圣永,仇佳捷,丁高耀.门式起重机主梁挠度双目摄影测量的标定方法研究[J].合肥工业大学学报（自然科学版）,2024,47(8):1042-1048.

组合机床与自动化加工技术

2024年第8期

浏览历史

内容加载中请稍等...

基于改进DDQN的无人车路径规划算法

参考文献10

二级参考文献142

共引文献253

相关作者

相关机构

相关主题

浏览历史