基于改进Q-learning算法和DWA的路径规划被引量：2

Path planning based on improved Q-learning algorithm and DWA

下载PDF

导出

摘要针对传统Q-learning算法出现的规划路线转折点多,探索效率低,以及无法实现动态环境下的路径规划问题,提出一种基于改进Q-learning算法和动态窗口法(DWA)的融合算法。首先,改变传统Q-learning算法的搜索方式,由原先的8方向变成16方向;利用模拟退火算法对Q-learning进行迭代优化;通过路径节点优化算法进行节点简化,提高路径平滑度。然后,提取改进Q-learning算法规划路径的节点,将其作为DWA算法的临时目标,前进过程中,能够实时躲避环境中出现的动静态障碍物。最终实验结果表明:融合算法具有较好的路径规划能力,实现了全局最优和有效避障的效果。 Aiming at the problems of traditional Q-learning algorithm with many turning points in the planning route,low exploration efficiency,and the inability to achieve path planning in dynamic environment,a fusion algorithm based on improved Q-learning algorithm and dynamic window approach(DWA)is proposed.The search method of traditional Q-learning algorithm is changed from the original 8 directions to 16 directions.The simulated annealing algorithm is used to iteratively optimize Q-learning.The path node optimization algorithm is used to simplify the nodes and improve the smoothness of the path.Then the nodes of the improved Q-learning algorithm planning path are extracted as the temporary target points of DWA algorithm.In the process of moving forward,the dynamic and static obstacles in the environment can be avoided in real time.The experimental results show that the fusion algorithm has better path planning ability,and achieves the effect of global optimum and effective obstacle avoidance.

作者王志伟邹艳丽刘唐慧美侯凤萍余自淳 WANG Zhiwei;ZOU Yani;LIU Tanghuimei;HOU Fengping;YU Zichun(College of Electronic Engineering,Guangxi Normal University,Guilin 541004,China)

机构地区广西师范大学电子工程学院

出处《传感器与微系统》 CSCD 北大核心 2023年第9期148-152,共5页 Transducer and Microsystem Technologies

基金广西重大科技专项项目(桂科AA21077015) 广西多源信息挖掘与安全重点实验室系统性研究课题基金资助项目(13—A—02—03)。

关键词 Q-learning算法路径规划动态窗口法 Q-learning algorithm path planning dynamic window approach(DWA)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献19

1王立玲,单忠宇,马东,王洪瑞.基于改进Camshift算法的NAO机器人目标跟踪[J].半导体光电,2020,41(6):896-901. 被引量：5
2陈一超,刘秉琦,黄富瑜.面向小型机器人的超大视场红外立体视觉可行性分析[J].半导体光电,2019,40(2):266-270. 被引量：3
3刘永建,曾国辉,黄勃.改进蚁群优化算法的移动机器人路径规划研究[J].传感器与微系统,2020,39(4):56-58. 被引量：18
4刘宁宁,王宏伟.基于改进灰狼优化算法的移动机器人路径规划[J].电测与仪表,2020,57(1):76-83. 被引量：41
5夏冬,李磊,杨恬恬,张剑,徐晶,苏粟.多信息融合下电动汽车充电路径规划[J].电测与仪表,2020,57(22):24-32. 被引量：4
6谢景海,苏东禹,卢诗华,贾祎轲,孙密,郭嘉.基于改进蚁群算法的输电线路路径规划关键技术[J].电测与仪表,2020,57(4):122-128. 被引量：27
7胡佳斌,王祥澍,张琪,全瑞坤.优化多步长蚁群算法求解机器人路径规划问题[J].传感器与微系统,2021,40(10):121-124. 被引量：9
8赵江,张岩,马泽文,叶子超.对AGV路径规划A星算法的改进与验证[J].计算机工程与应用,2018,54(21):217-223. 被引量：37
9乔云侠,王庆,阳媛,张益.基于背向障碍物搜索A^*算法的平滑路径规划[J].传感器与微系统,2020,39(8):127-129. 被引量：9
10魏彤,龙琛.基于改进遗传算法的移动机器人路径规划[J].北京航空航天大学学报,2020,46(4):703-711. 被引量：102

二级参考文献138

1魏宁,刘一松.基于栅格模型的移动机器人全局路径规划研究[J].微计算机信息,2008,24(11):229-231. 被引量：15
2乔俊飞,侯占军,阮晓钢.基于神经网络的强化学习在避障中的应用[J].清华大学学报（自然科学版）,2008,48(S2):1747-1750. 被引量：27
3闫钧华,陈少华,艾淑芳,李大雷,段贺.基于Kalman预测器的改进的CAMShift目标跟踪[J].中国惯性技术学报,2014,12(4):536-542. 被引量：29
4胡小明,吴耿锋,樊建.基于时间栅格法和免疫算法的机器人动态路径规[J].微型电脑应用,2005,21(2):8-12. 被引量：2
5于红斌,李孝安.基于栅格法的机器人快速路径规划[J].微电子学与计算机,2005,22(6):98-100. 被引量：63
6窦全胜,周春光,徐中宇,潘冠宇.动态优化环境下的群核进化粒子群优化方法[J].计算机研究与发展,2006,43(1):89-95. 被引量：20
7余有明,刘玉树,阎光伟.遗传算法的编码理论与应用[J].计算机工程与应用,2006,42(3):86-89. 被引量：59
8马兆青,袁曾任.基于栅格方法的移动机器人实时导航和避障[J].机器人,1996,18(6):344-348. 被引量：91
9黄炳强,曹广益,王占全.强化学习原理、算法及应用[J].河北工业大学学报,2006,35(6):34-38. 被引量：19
10王景存,张晓彤,陈彬,陈和平.一种基于Dijkstra算法的启发式最优路径搜索算法[J].北京科技大学学报,2007,29(3):346-350. 被引量：27

共引文献447

1刘珊,李建贵,李强,朱郭福,陈晨.电动汽车长途出行路径引导方法[J].数字制造科学,2022(4):314-318. 被引量：1
2谢懿.基于大数据的船舶航行最优路径规划算法研究[J].舰船科学技术,2019,41(20):22-24. 被引量：5
3金翔,王天霖,于鹏垚,赵勇.基于值迭代网络的路径规划算法[J].华中科技大学学报（自然科学版）,2020,48(2):91-96. 被引量：1
4王振威,刘凯,郭健,刘晓鹏.一种基于领导-跟随策略的多无人机-多无人艇编队协同机制[J].航空学报,2023,44(S02):453-468.
5朱明哲,孙丙宇.基于遗传算法的工厂仓储系统多AGV调度策略研究[J].电子技术（上海）,2021(1):33-37. 被引量：2
6王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
7邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：3
8邢孟阳,杜嘉豪,吴竟启,束磊,郭中陽.基于改进A^(*)算法的复杂停车场路径规划[J].智能计算机与应用,2022,12(4):126-129. 被引量：3
9王怀江,刘晓平,王刚,韩松.基于改进遗传算法的移动机械臂拣选路径优化[J].北京邮电大学学报,2020(5):34-40. 被引量：21
10成静清,宋松柏.基于混合分布非一致性年径流序列频率参数的计算[J].西北农林科技大学学报（自然科学版）,2010,38(2):229-234. 被引量：25

同被引文献16

1周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：7
2邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：3
3王奇,黎海涛.基于机器学习与惯性导航的室内定位技术研究[J].电子测量技术,2016,39(8):138-143. 被引量：7
4高天航,吕靖,赖成寿.考虑船舶偏好的海上风险规避路径规划研究[J].运筹与管理,2018,27(11):43-49. 被引量：3
5卫玉梁,靳伍银.基于神经网络Q-learning算法的智能车路径规划[J].火力与指挥控制,2019,44(2):46-49. 被引量：18
6刘俊利.基于TensorFlow的Q-Learning算法研究与实现[J].现代计算机,2019,0(29):26-28. 被引量：1
7张丹红,陈文文,张华军,苏义鑫.A^*算法与蚁群算法相结合的无人艇巡逻路径规划[J].华中科技大学学报（自然科学版）,2020,48(6):13-18. 被引量：42
8李腾,曹世杰,尹思薇,魏大卫,马鑫迪,马建峰.应用Q学习决策的最优攻击路径生成方法[J].西安电子科技大学学报,2021,48(1):160-167. 被引量：13
9王军,杨云霄,李莉.基于改进深度强化学习的移动机器人路径规划[J].电子测量技术,2021,44(22):19-24. 被引量：19
10张韬,项祺,郑婉文,孙宇祥,周献中.基于改进A^(*)算法的路径规划在海战兵棋推演中的应用[J].兵工学报,2022,43(4):960-968. 被引量：8

引证文献2

1潘禄生.基于强化学习的自动化渗透测试方法[J].电子制作,2024,32(9):107-110.
2李鹏程,周远国,杨国卿.基于深度Q网络的海上环境智能路径规划[J].电子测量技术,2024,47(5):77-84.

1李杰.基于改进A_Star算法的移动机器人动态路径规划[J].黑龙江科学,2023,14(16):47-52. 被引量：3
2宣捷,王璐,彭颖.基于ROS2.0四足抓取机器人的设计[J].洛阳理工学院学报（自然科学版）,2023,33(3):52-58.
3陈森基.基于Q-learning算法的多天线无线携能通信安全传输方案研究[J].通信电源技术,2023,40(15):5-7.
4杨瑞鹏.基于输电线路无人机巡检路径规划应用研究[J].电力设备管理,2023(16):130-132. 被引量：1
5摆志俊.基于蚁群算法的输变电工程选址选线规划方法[J].波谱学杂志,2023,40(3).
6陈昆,曲大义,王少杰,王其坤.基于二次分解和融合多特征的短时交通流量组合预测模型[J].广西师范大学学报（自然科学版）,2023,41(4):33-46.
7柳宁,崔小军,绳鹏鹏,张超,雷兴.基于SLAM的电厂巡检机器人导航技术实现[J].自动化与仪器仪表,2023(7):214-218. 被引量：1
8张省,张樊宇.防疫物资“无接触”机器人配送优化研究[J].计算机工程与应用,2023,59(17):295-307. 被引量：5
9程擎,王圣淳,李云飞,刘厚荣.耦合改进JPS与DWA的无人机航迹规划[J].电光与控制,2023,30(9):52-55.
10李恒鑫.高速磁浮车站客运列车作业方案优化研究[J].高速铁路技术,2023,14(4):89-94. 被引量：1

传感器与微系统

2023年第9期

浏览历史

内容加载中请稍等...

基于改进Q-learning算法和DWA的路径规划被引量：2

参考文献19

二级参考文献138

共引文献447

同被引文献16

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进Q-learning算法和DWA的路径规划 被引量：2

参考文献19

二级参考文献138

共引文献447

同被引文献16

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进Q-learning算法和DWA的路径规划被引量：2