题名 基于深度强化学习算法的无人机智能规避决策
1
作者
吴冯国
陶伟
李辉
张建伟
郑成辰
机构
四川大学视觉合成图形图像技术国防重点学科实验室
中国舰船研究设计中心
四川大学计算机学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2023年第6期1702-1711,共10页
基金
“十三五”全军共用信息系统装备预研项目(31505550302)资助课题。
文摘
为提升无人机在复杂空战场景中的存活率,基于公开无人机空战博弈仿真平台,使用强化学习方法生成机动策略,以深度双Q网络(double deep Q-network, DDQN)和深度确定性策略梯度(deep deterministic policy gradient, DDPG)算法为基础,提出单元状态序列(unit state sequence, USS),并采用门控循环单元(gated recurrent unit, GRU)融合USS中的态势特征,增加复杂空战场景下的状态特征识别能力和算法收敛能力。实验结果表明,智能体在面对采用标准比例导引算法的导弹攻击时,取得了98%的规避导弹存活率,使无人机在多发导弹同时攻击的复杂场景中,也能够取得88%的存活率,对比传统的简单机动模式,无人机的存活率大幅提高。
关键词
深度强化学习
无人机
单元状态序列
门控循环单元
Keywords
deep reinforcement learning(DRL)
unmanned aerial vehicles(UAVs)
unit state sequence(USS)
gated recurrent unit(GRU)
分类号
E926
[兵器科学与技术—武器系统与运用工程]
TP181
[自动化与计算机技术—控制理论与控制工程]
V211
[航空宇航科学与技术—航空宇航推进理论与工程]
题名 基于优化人工势场法的无人机航迹规划
被引量:8
2
作者
王庆禄
吴冯国
郑成辰
李辉
机构
四川大学计算机学院(软件学院)
四川大学视觉合成图形图像技术国家级重点实验室
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2023年第5期1461-1468,共8页
基金
国家自然科学基金重点项目(U20A20161)资助课题。
文摘
针对传统人工势场(traditional artificial potential field,TAPF)法在无人机航迹规划中存在的局部极小值、斥力过大、无效避障等问题,提出一种优化人工势场法。首先将障碍物斥力进行分解,避免了局部极小值情况;其次重构合力计算方式,避免无人机在障碍密集区域所受斥力过大;最后引入二次碰撞预测方法,减少无人机无效避障的同时保证航迹平滑。在考虑无人机物理约束条件下进行航迹规划实验。仿真结果表明,该方法相较于TAPF法,不仅缩短了规划航线长度,且在航迹平滑性上有明显提升。
关键词
人工势场法
航迹规划
物理约束
碰撞预测
航迹平滑
Keywords
artificial potential field method
path planning
physical constraint
collision predict
smooth trajectory
分类号
V249
[航空宇航科学与技术—飞行器设计]
题名 基于深度强化学习的导弹末端约束角制导律
被引量:1
3
作者
郑成辰
李辉
陶伟
刘思成
吴冯国
何立
机构
四川大学计算机学院
四川大学视觉合成图形图像技术国防重点学科实验室
中国舰船研究设计中心
出处
《战术导弹技术》
北大核心
2022年第6期93-102,110,共11页
基金
“十三五”全军共用信息系统装备预研项目(31505550302)
文摘
拦截碰撞角约束制导可以增加空空导弹的毁伤能力,而传统的比例导引律无法对导弹的打击角度进行约束。为控制空空导弹的拦截碰撞角,提出了一种基于深度强化学习的偏置比例导引律,完成了以特定倾角拦截目标的任务。引入了导弹剩余飞行时间作为强化学习模型的部分状态量,提升了智能体的学习收敛速度。与传统的比例导引律和基于落角约束的最优导引律进行了仿真对比实验。仿真结果表明,所提出的制导律在保证精准拦截目标的同时,对导弹末端碰撞角的控制精度也大于其它约束角制导律。
关键词
深度强化学习
末端约束角
比例导引律
偏置导引律
剩余飞行时间估计
过载控制
Keywords
deep reinforcement learning
terminal angle constraint
proportional navigation guidance law
bias guidance law
recursive time-to-go estimation
overload control
分类号
TJ765
[兵器科学与技术—武器系统与运用工程]