基于速度障碍-近端策略优化的无人机避障方法

UAV Obstacle Avoidance Method Based on Velocity Obstacle-Proximal Policy Optimization

下载PDF

导出

摘要针对无人机在复杂障碍物环境下避障的问题,提出了一种基于速度障碍-近端策略优化的避障策略。根据无人机自身信息和速度障碍法描述的障碍物信息构建状态空间,设计基于速度障碍区域同时包括速度和距离的奖惩函数。在Actor-Critic网络结构下设计近端策略优化的算法框架,通过智能体与环境交互,训练出奖励最大化下的网络参数,实现了无人机在复杂环境中的避障。通过在仿真实验中与其他算法进行各项指标参数的对比分析,证明了所提算法具有良好的泛化性和有效性。 Focusing on the problem of obstacle avoidance of UAV in complex obstacle environment,an obstacle avoidance strategy based on VO-PPO is proposed.Firstly,the state space is constructed according to the UAV's own information and the obstacle information described by the velocity obstacle method,and the reward and punishment function based on VO region including speed and distance is designed.Secondly,an algorithm framework of Proximal Policy Optimization is designed under the Actor-Critic network structure,through the interaction of agent and environment,network parameters under the condition of maximum reward are trained,and obstacle avoidance of UAV in different environments is realized.Finally,compared with other algorithms in simulation experiments,the proposed algorithm is proved to have great generalization and effectiveness.

作者焦卫东刘爽张思远 JIAO Wei-dong;LIU Shuang;ZHANG Si-yuan(Civil Aviation University of China,Tianjin 300000)

机构地区中国民航大学

出处《航空计算技术》 2024年第3期16-19,24,共5页 Aeronautical Computing Technique

基金国家重点基础研究发展计划项目资助(2020YFB1600101)。

关键词深度强化学习无人机避障复杂环境 deep reinforcement learning UAV obstacle avoiding complex environment

分类号 V279 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献3

1Tong GUO,Nan JIANG,Biyue LI,Xi ZHU,Ya WANG,Wenbo DU.UAV navigation in high dynamic environments:A deep reinforcement learning approach[J].Chinese Journal of Aeronautics,2021,34(2):479-489. 被引量：14
2张宏宏,甘旭升,李双峰,冯政,靳阳.复杂低空环境下考虑区域风险评估的无人机航路规划[J].仪器仪表学报,2021,42(1):257-266. 被引量：47
3张哲,吴剑,代冀阳,应进,何诚.基于改进A-Star算法的隐身无人机快速突防航路规划[J].航空学报,2020,41(7):248-258. 被引量：24

二级参考文献17

1丁晓东,刘毅,李为民.基于动态RCS的无人机航迹实时规划方法研究[J].系统工程与电子技术,2008,30(5):868-871. 被引量：18
2田阔,符小卫,高晓光.威胁联网下无人机路径在线规划[J].西北工业大学学报,2011,29(3):367-373. 被引量：18
3晏青,熊峻江,游思明.基于动态RCS的无人机航迹实时规划[J].北京航空航天大学学报,2011,37(9):1115-1121. 被引量：14
4史伟强,徐乐,史小卫,汪宁.基于完备对数正态分布模型的隐形飞行器动态RCS统计特性研究[J].电子与信息学报,2013,35(9):2121-2125. 被引量：14
5莫松,黄俊,郑征,刘伟.基于改进快速扩展随机树方法的隐身无人机突防航迹规划[J].控制理论与应用,2014,31(3):375-385. 被引量：13
6Ouyang Jian,Zhuang Yi,Lin Min,Liu Jia.Optimization of beamforming and path planning for UAV-assisted wireless relay networks[J].Chinese Journal of Aeronautics,2014,27(2):313-320. 被引量：16
7陈世春,黄沛霖,姬金祖.典型隐身飞机的RCS起伏统计特性[J].航空学报,2014,35(12):3304-3314. 被引量：26
8Yao Peng,Wang Honglun,Su Zikang.UAV feasible path planning based on disturbed fluid and trajectory propagation[J].Chinese Journal of Aeronautics,2015,28(4):1163-1177. 被引量：21
9张启瑞,魏瑞轩,何仁珂,茹常剑,周凯.城市密集不规则障碍空间无人机航路规划[J].控制理论与应用,2015,32(10):1407-1413. 被引量：32
10魏潇龙,姚登凯,谷志鸣,高文明.基于分割法的无人机路径规划研究[J].计算机仿真,2016,33(1):90-94. 被引量：9

共引文献81

1王振威,刘凯,郭健,刘晓鹏.一种基于领导-跟随策略的多无人机-多无人艇编队协同机制[J].航空学报,2023,44(S02):453-468.
2陈丽,陈洋,杨艳华.面向三维结构视觉检测的无人机覆盖路径规划[J].电子测量与仪器学报,2023,37(2):1-10. 被引量：9
3李奇洋,涂海燕,叶鸿达.考虑地面行人安全的无人机低风险路径规划策略[J].电子测量技术,2023,46(20):58-64.
4李研强,郑亚雯,张岱峰,李超,张超.基于DRF优化采样的无人车轨迹规划方法[J].电子测量技术,2023,46(5):105-112. 被引量：1
5林锐杰,廖可非.基于Android的无人机自主飞行系统设计与实现[J].国外电子测量技术,2023,42(2):185-191. 被引量：2
6黄令苇,全燕鸣,王荣辉.基于安全A*算法的AGV路径规划[J].自动化与仪表,2021,36(1):45-48. 被引量：4
7张哲,吴剑,代冀阳,李品伟.基于改进A^(*)算法的多无人机协同战术规划[J].兵工学报,2020,41(12):2530-2539. 被引量：18
8于晓强,郭继峰,赵毓,颜鹏.月面巡视机器人快速安全路径规划[J].航空学报,2021,42(1):270-276. 被引量：3
9李玲玲,韩瑞玲,张晓燕.城市低空空域可用空间识别与容量评估——以北京市为例[J].科学技术与工程,2021,21(19):8253-8261. 被引量：6
10华厚强.模块化低空长航时无人机的设计与实现[J].电子测量技术,2021,44(9):13-21. 被引量：7

航空计算技术

2024年第3期

浏览历史

内容加载中请稍等...

基于速度障碍-近端策略优化的无人机避障方法

参考文献3

二级参考文献17

共引文献81

相关作者

相关机构

相关主题

浏览历史