基于导向强化Q学习的无人机路径规划被引量：23

Path planning of UAV using guided enhancement Q-learning algorithm

导出

摘要随着无人机的广泛应用,其飞行能耗和计算能力面临着瓶颈问题,因此无人机路径规划研究越来越重要。很多情况下,无人机并不能提前获得目标点的确切位置和环境信息,往往无法规划出一条有效的飞行路径。针对这一问题,提出了基于导向强化Q学习的无人机路径规划方法,该方法利用接收信号强度定义回报值,并通过Q学习算法不断优化路径;提出"导向强化"的原则,加快了学习算法的收敛速度。仿真结果表明,该方法能够实现无人机的自主导航和快速路径规划,与传统算法相比,大大减少了迭代次数,能够获得更短的规划路径。 With the increasing application of the Unmanned Aerial Vehicle(UAV)technology,the energy consumption and computing capacity of UAV are faced with bottleneck problems,so path planning of UAV is becoming increasingly important.In many cases,the UAV cannot obtain the exact location of the target point and environmental information in advance,and thus is difficult to plan an effective flight path.To solve this problem,this paper proposes a path planning method for UAV using the guided enhancement Q-learning algorithm.This method uses Receiving Signal Strength(RSS)to define the reward value,and continuously optimizes the path by using the Q-learning algorithm.The principle of“guided reinforcement”is proposed to accelerate the convergence speed of the Qlearning algorithm.The simulation results show that the method proposed can realize autonomous navigation and fast path planning for UAV.Compared with the traditional algorithm,it can greatly reduce the number of iterations and obtain a shorter planned path.

作者周彬郭艳李宁钟锡健 ZHOU Bin;GUO Yan;LI Ning;ZHONG Xijian(College of Communications Engineering,Army Engineering University of PL A.Nanjing 210007,China)

机构地区陆军工程大学通信工程学院

出处《航空学报》 EI CAS CSCD 北大核心 2021年第9期498-505,共8页 Acta Aeronautica et Astronautica Sinica

基金国家自然科学基金(61871400)。

关键词无人机路径规划接收信号强度 Q学习算法导向强化 UAV path planning receiving signal strength Q-learning algorithm guided enhancement

分类号 V279 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献1

1陈崚,孙海鹰.蚁群算法一阶欺骗性问题的时间复杂度分析[J].模式识别与人工智能,2010,23(1):1-6. 被引量：3

二级参考文献33

1黄翰,郝志峰,吴春国,秦勇.蚁群算法的收敛速度分析[J].计算机学报,2007,30(8):1344-1353. 被引量：72
2Dorigo M, StUtzle T. Ant Colony Optimization. New York, USA: MIT Press, 2004.
3Dorigo M, Blum C. Ant Colony Optimization Theory: A Survey. Fheoretical Computer Science, 2005, 344 (2/3) : 243 - 278.
4Blum C. Ant Colony Optimization: Introduction and Recent Trends. Physics of Life Reviews, 2005, 2(4) : 353 -373.
5Shtovba S. Ant Algorithms: Theory and Applications. Programming and Computer Software, 2005, 31 (4) : 167 - 178.
6Dreo J, Siarry P. Continuous Interacting Ant Colony Algorithm Based on Dense Hierarchy. Future Generation Computer Systems, 2004, 20(5) : 841 -856.
7Elbeltagi E, Hegazy T, Grierson D. Comparison among Five Evolutionary-Based Optimization Algorithms. Advanced Engineering Informatics, 2005, 19( 1 ) : 43 -53.
8Stefan J, Daniel M, Middendorf M, et al. On Enforced Convergence of ACO and Its Implementation on the Reconfigurable Mesh Architecture Using Size Reduction Tasks. Journal of Supercomputing, 2003, 26(3) : 221 -238.
9Martin M, Frank R, Hartmut S. Multi Colony Ant Algorithms. Journal of Heuristics, 2002, 8 (3) : 305 - 320.
10Sun Jun, Xiong Shengwu, Guo Fuming. A New Pheromone Updating Strategy in Ant Colony Optimization//Proc of the International Conference on Machine Learning and Cybernetics. Shanghai, China, 2004, Ⅰ: 620 - 625.

共引文献2

1马永杰,云文霞.遗传算法研究进展[J].计算机应用研究,2012,29(4):1201-1206. 被引量：423
2王依柔,张达敏.融合正弦余弦和无限折叠迭代混沌映射的蝴蝶优化算法[J].模式识别与人工智能,2020,33(7):660-669. 被引量：24

同被引文献282

1魏立新,高嘉良,蒋容,王中专,王力,叶霖.基于BFS算法的油田污水系统参数计算方法研究[J].当代化工,2021(1):117-122. 被引量：1
2何健,文晓涛,聂文亮,李雷豪,杨吉鑫.利用随机森林算法预测裂缝发育带[J].石油地球物理勘探,2020,55(1):161-166. 被引量：7
3蔺一帅,李青山,陆鹏浩,孙雨楠,王亮,王颖芝.智能仓储货位规划与AGV路径规划协同优化算法[J].软件学报,2020,31(9):2770-2784. 被引量：22
4王苏彧,张铃炜,齐佳丽,盖禹成.自适应导向蚁群算法优化移动机器人路径规划[J].计算机应用研究,2020,37(S01):116-117. 被引量：9
5李辉,祁宇明.一种复杂环境下基于深度强化学习的机器人路径规划方法[J].计算机应用研究,2020,37(S01):129-131. 被引量：13
6吴坤,谭劭昌.基于改进鲸鱼优化算法的无人机航路规划[J].航空学报,2020(S02):107-114. 被引量：26
7戴健,许菲,陈琪锋.多无人机协同搜索区域划分与路径规划[J].航空学报,2020(S01):149-156. 被引量：28
8孙斌,韩大鹏,韦庆.基于滚动窗口算法的机器人路径规划应用研究[J].计算机仿真,2006,23(6):159-162. 被引量：9
9王小艺,刘载文,侯朝桢,张翠,原菊梅.基于模糊多属性决策的目标威胁估计方法[J].控制与决策,2007,22(8):859-863. 被引量：43
10高劲松,邹庆元,陈哨东.无人机自主性概念研究[J].电光与控制,2007,14(5):58-61. 被引量：19

引证文献23

1尚熙,杨革文,戴少怀,蒋伊琳.基于强化学习的一对多雷达干扰资源分配策略研究[J].空天防御,2022,5(1):94-101. 被引量：1
2张震,臧兆祥,郭鸿村,田佩.存在危险区域的路径规划问题研究[J].长江信息通信,2022,35(4):14-19. 被引量：1
3杨秀霞,高恒杰,刘伟,张毅.基于阶段Q学习算法的机器人路径规划[J].兵器装备工程学报,2022,43(5):197-203. 被引量：5
4王涛,黎玉康,刘文学.无人车辆路径规划算法发展现状[J].舰船电子工程,2022,42(5):15-22. 被引量：1
5杨秀霞,高恒杰,刘伟,张毅.基于LSTM深度强化学习的UAV反应式避障方法[J].飞行力学,2022,40(4):47-55. 被引量：5
6周同乐,陈谋.基于动态目标概率分布的核电站无人机航路强化学习规划[J].中国科学：信息科学,2022,52(9):1642-1655. 被引量：3
7张鑫菠,李乐,冀海军,彭星光.基于Q学习的水下滑翔机路径规划方法[J].计算机测量与控制,2022,30(11):192-198.
8曹景祥,刘其成.基于深度强化学习的路径规划算法研究[J].计算机应用与软件,2022,39(11):231-237. 被引量：3
9刘庆健,疏利生,刘刚,李翱.低空无人机路径规划算法综述[J].航空工程进展,2023,14(2):24-34. 被引量：5
10陈辉,魏凤旗,韩崇昭.多扩展目标跟踪优化中基于威胁规避的无人机路径规划策略[J].雷达学报（中英文）,2023,12(3):529-540.

二级引证文献29

1刘明,金日初.阶段性规划方法对长江干线航道整治进度的优化[J].中国水运（下半月）,2023(1):66-68.
2张利.基于LSTM神经网络的采煤机牵引速度智能预测研究[J].山西能源学院学报,2022,35(5):15-17. 被引量：1
3王尔申,刘帆,宏晨,郭靖,何宁,赵琳,薛健.基于MASAC的无人机集群对抗博弈方法[J].中国科学：信息科学,2022,52(12):2254-2269. 被引量：3
4杨秀霞,王晨蕾,张毅,于浩,姜子劼.基于增量式发育深度强化学习的无人机路径规划[J].飞行力学,2023,41(3):40-46. 被引量：2
5沈曈,张昱彤,陈敬贤,赵一,潘劲伟.人工智能在计算机信息中的标准化运用[J].数字技术与应用,2023,41(6):74-76.
6刘泽琳,张袁元,杨旺嗣,陆馨缘,顾家成,陈俊逸.基于SLAM的自主避障物流无人机系统设计[J].机电工程技术,2023,52(7):60-63. 被引量：3
7李明,陈金良,刘文,王琳,赵健竹.面向城市空中交通的eVTOL飞行器路径规划算法对比[J].西华大学学报（自然科学版）,2023,42(5):54-61.
8张敬宜,李明超,张佳文,张梦溪,闫文钰.基于增量动力分析与多层感知机的混凝土坝地震易损性评估[J].南水北调与水利科技（中英文）,2023,21(5):1030-1039. 被引量：1
9董子敬,李凡,孙宏,朱梦媛,范博艺.基于Informer模型的进近阶段工作负荷管理胜任力评估[J].飞行力学,2023,41(5):81-87.
10李永迪,李彩虹,张耀玉,张国胜,周瑞红,梁振英.基于APF-LSTM-DDPG算法的移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2024,38(1):33-41.

1董箭,初宏晟,卢杬樟,唐露露,戴佳良.基于A星算法的无人机路径规划优化模型研究[J].海洋测绘,2021,41(3):28-31. 被引量：12
2马彬,郭湛彬,谢显中.异构无线网络自适应接入算法研究[J].重庆邮电大学学报（自然科学版）,2021,33(5):743-750. 被引量：2
3罗庆,张涛,单鹏,张文涛,刘子豪.基于改进Q学习的IMA系统重构蓝图生成方法[J].航空学报,2021,42(8):320-329. 被引量：8
4李振龙,张靖思,刘钦,邢冠仰.基于改进Q学习的双周期干线信号协调控制方法[J].科学技术与工程,2021,21(29):12744-12750. 被引量：3
5杨家兴.基于关联规则的网络信息协同过滤推荐算法[J].信息与电脑,2021,33(17):63-65.
6周雅怡,宋伟杰,黄晓英,凌华明,黄明磊.面向电力交易分布式账本的改进共识算法研究[J].电力大数据,2021,24(6):52-59. 被引量：2
7王艳.基于领域类别信息的关键词提取技术[J].大众标准化,2021(18):212-213.
8李益广,张足生,吴晓鸰,李文杰,张先才.一种抗干扰的磁阻传感器车辆检测算法[J].东莞理工学院学报,2021,28(5):38-44.
9曹静,吴灿灿,梁洪波.地震映像法在徐州地铁断裂带探测中的应用[J].安阳工学院学报,2021,20(6):67-70. 被引量：1
10陈锴,罗文广.用于桥梁病害检测的无人机地面站设计及实现[J].广西科技大学学报,2021,32(4):35-42. 被引量：6

航空学报

2021年第9期

浏览历史

内容加载中请稍等...

基于导向强化Q学习的无人机路径规划被引量：23

参考文献1

二级参考文献33

共引文献2

同被引文献282

引证文献23

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于导向强化Q学习的无人机路径规划 被引量：23

参考文献1

二级参考文献33

共引文献2

同被引文献282

引证文献23

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于导向强化Q学习的无人机路径规划被引量：23