基于APF-DQN的空战机动决策方法被引量：2

Air combat maneuvering decision method based on APF-DQN

导出

摘要针对强化学习中奖励信号稀疏导致价值函数收敛慢的问题,提出结合人工势场(Artificial Potential Field, APF)法和深度Q学习网络(Deep Q-learning Network, DQN)的空战机动决策方法。描述了空战机动态势,建立了空战机动人工势场模型,设计了一阶APF奖励函数,构造了基于DQN的空战决策模型,提出了基于APF-DQN的空战机动决策方法,最后进行了仿真试验。仿真结果表明,所提方法能够解决奖励信号稀疏的问题,使我方战机能够很好地进行轨迹跟踪,占据有利态势。 In order to solve the problem of slow convergence of value function caused by sparse reward signals in reinforcement learning, an air combat maneuvering decision method combining artificial potential field and deep Q-learning network was proposed. The air combat maneuver situation was described, and the artificial potential field model of air combat maneuver was established. The first-order APF reward function was designed, and the air combat maneuver decision model based on DQN was constructed. Air combat maneuver decision method based on APF-DQN was proposed, and the simulation test was carried out at last. Simulation results show that this method can solve the problem of sparse reward signal, and make our fighter aircraft can track the trajectory well and occupy a favorable situation.

作者张晓杰周中良 ZHANG Xiaojie;ZHOU Zhongliang(Air Force Engineering University,Xi’an 710038,China)

机构地区空军工程大学

出处《飞行力学》 CSCD 北大核心 2021年第5期88-94,共7页 Flight Dynamics

关键词空战机动人工势场奖励函数强化学习 air combat maneuvering APF reward function reinforcement learning

分类号 V271.4 [航空宇航科学与技术—飞行器设计] E91 [军事]

引文网络
相关文献

参考文献13

1嵇慧明,余敏建,乔新航,杨海燕,张帅文.改进BAS-TIMS算法在空战机动决策中的应用[J].国防科技大学学报,2020,42(4):123-133. 被引量：8
2左家亮,杨任农,张滢,李中林,邬蒙.基于启发式强化学习的空战机动智能决策[J].航空学报,2017,38(10):212-225. 被引量：53
3董一群,艾剑良.自主空战技术中的机动决策:进展与展望[J].航空学报,2020(S02):4-12. 被引量：12
4王雨琪,宁国栋,王晓峰,郝明瑞,王江华.基于微分对策的临近空间飞行器机动突防策略[J].航空学报,2020(S02):69-78. 被引量：15
5吴江,宋晗,周锐,陈宗基.基于扩展影响图的超视距空战辅助决策方法[J].控制与决策,2010,25(11):1669-1674. 被引量：5
6何旭,景小宁,冯超.基于蒙特卡洛树搜索方法的空战机动决策[J].空军工程大学学报（自然科学版）,2017,18(5):36-41. 被引量：12
7HUANG Changqiang,DONG Kangsheng,HUANG Hanqiao,TANG Shangqin,ZHANG Zhuoran.Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization[J].Journal of Systems Engineering and Electronics,2018,29(1):86-97. 被引量：60
8张宏鹏,黄长强,轩永波,唐上钦.基于深度神经网络的无人作战飞机自主空战机动决策[J].兵工学报,2020,41(8):1613-1622. 被引量：21
9李世豪,丁勇,高振龙.基于直觉模糊博弈的无人机空战机动决策[J].系统工程与电子技术,2019,41(5):1063-1070. 被引量：32
10张涛,于雷,周中良,王琳.基于混合算法的空战机动决策[J].系统工程与电子技术,2013,35(7):1445-1450. 被引量：29

二级参考文献110

1王亚帆,周韬,陈万春,赫泰龙.基于脱靶量级数解的最优机动突防策略[J].北京航空航天大学学报,2020,46(1):159-169. 被引量：6
2傅莉,王晓光.无人战机近距空战微分对策建模研究[J].兵工学报,2012,33(10):1210-1216. 被引量：20
3熊菁,程文科,秦子增.基于Serret-Frenet坐标系的翼伞系统轨迹跟踪控制[J].动力学与控制学报,2005,3(2):87-91. 被引量：6
4雍恩米,唐国金,罗亚中.弹道导弹中段机动突防制导问题的仿真研究[J].导弹与航天运载技术,2005(4):13-18. 被引量：18
5祝世虎,董朝阳,张金鹏,陈宗基.基于神经网络与专家系统的智能决策支持系统[J].电光与控制,2006,13(1):8-11. 被引量：15
6高永,向锦武.一种新的超视距空战威胁估计非参量法模型[J].系统仿真学报,2006,18(9):2570-2572. 被引量：43
7Bank S B, Lizza C S. Pilot's associate: A coopertive, knowledge-based system application[J]. IEEE Expert, 1991, 6(3): 18-29.
8Pipe H J. The UK management AID project[C]. IFAC Automatic Control in Aerospace. Ottobrunn, 1992: 263- 268.
9Walsdorf A, Onken R. The crew assistant military aircraft(CAMA)[EB/OL]. [1999-10-19]. http://papers.sae. org/1999-01-5537.
10Marsh H S, Quinn P W, Toth G J, et al. Tactical decision making: The interaction of human perception and judgment with automated information processing and presentation-decision support[C]. RTO Lecture Series 227: Tactical Decision Aids and Situational Awareness. Ottawa: St Joseph Corporation Company, 2002:301-317.

共引文献201

1倪炜霖,王永海,徐聪,赤丰华,梁海朝.基于强化学习的高超飞行器协同博弈制导方法[J].航空学报,2023,44(S02):55-66.
2马金毅,王灿,薛涛,艾剑良,董一群.空战格斗飞行机动数据库建立及应用[J].航空学报,2023,44(S01):39-47.
3胡艳艳,张莉,夏辉,张乃文,鄢镕易.不完全信息下基于微分对策的机动目标协同捕获[J].航空学报,2022,43(S01):53-64. 被引量：4
4董一群,艾剑良.自主空战技术中的机动决策:进展与展望[J].航空学报,2020(S02):4-12. 被引量：12
5周思羽,吴文海,孔繁峨,张楠.基于随机决策准则的改进多级影响图机动决策方法[J].北京理工大学学报,2013,33(3):296-301. 被引量：14
6杜海文,崔明朗,韩统,魏政磊,唐传林,田野.基于多目标优化与强化学习的空战机动决策[J].北京航空航天大学学报,2018,44(11):2247-2256. 被引量：21
7张强,杨任农,俞利新,张涛,左家亮.基于Q-network强化学习的超视距空战机动决策[J].空军工程大学学报（自然科学版）,2018,19(6):8-14. 被引量：19
8赵雨,张斌,徐安,李洪钶.双机协同战术对策及近似最优解[J].系统工程与电子技术,2015,37(3):589-593.
9顾佼佼,刘卫华,姜文志.基于攻击区和杀伤概率的视距内空战态势评估[J].系统工程与电子技术,2015,37(6):1306-1312. 被引量：35
10左家亮,杨任农,张滢,邬蒙,肖雨泽.基于模糊聚类的近距空战决策过程重构与评估[J].航空学报,2015,36(5):1650-1660. 被引量：16

同被引文献93

1王雨琪,宁国栋,王晓峰,郝明瑞,王江华.基于微分对策的临近空间飞行器机动突防策略[J].航空学报,2020(S02):69-78. 被引量：15
2董一群,艾剑良.自主空战技术中的机动决策:进展与展望[J].航空学报,2020(S02):4-12. 被引量：12
3钟麟,佟明安,钟卫,张圣云.基于影响图的空战机动决策模型[J].系统仿真学报,2007,19(8):1796-1798. 被引量：7
4Zhong Lin,Tong Ming'an,Zhong Wei,Zhang Shengyun.Sequential maneuvering decisions based on multi-stage influence diagram in air combat[J].Journal of Systems Engineering and Electronics,2007,18(3):551-555. 被引量：7
5钟友武,柳嘉润,杨凌宇,申功璋.自主近距空战中机动动作库及其综合控制系统[J].航空学报,2008,29(B05):114-121. 被引量：24
6张翔伦,杨蔷薇.基于机动动作库的实时轨迹生成与仿真研究[J].飞行力学,2008,26(3):29-32. 被引量：9
7钟友武,杨凌宇,柳嘉润,申功璋.基于智能微分对策的自主机动决策方法研究[J].飞行力学,2008,26(6):29-33. 被引量：4
8陈军,高晓光,符小卫.基于粗糙集理论与贝叶斯网络的超视距空战战术决策[J].系统仿真学报,2009,21(6):1739-1742. 被引量：11
9马耀飞,龚光红,彭晓源.基于强化学习的航空兵认知行为模型[J].北京航空航天大学学报,2010,36(4):379-383. 被引量：14
10刘正敏,昂亮,姜长生,吴庆宪.多级影响图在无人机群协同空战机动决策中的应用[J].电光与控制,2010,17(10):10-13. 被引量：10

引证文献2

1殷宇维,王凡,吴奎,胡剑秋.基于改进DDPG的空战行为决策方法[J].指挥控制与仿真,2022,44(1):97-102. 被引量：5
2陈浩,黄健,刘权,周思航,张中杰.自主空战机动决策技术研究进展与展望[J].控制理论与应用,2023,40(12):2104-2129. 被引量：2

二级引证文献7

1李波,白双霞,孟波波,梁诗阳,李曾琳.基于SAC算法的无人机自主空战决策算法[J].指挥控制与仿真,2022,44(5):24-30. 被引量：7
2李卓远,张德平.基于BN-DDPG轻量级强化学习算法的智能兵棋推演[J].计算机系统应用,2023,32(4):293-299. 被引量：1
3陈浩,黄健,刘权,周思航,张中杰.自主空战机动决策技术研究进展与展望[J].控制理论与应用,2023,40(12):2104-2129. 被引量：2
4黄希杰.基于DDPG的四旋翼无人机姿态控制[J].指挥控制与仿真,2024,46(2):115-121. 被引量：1
5刘欣,张倩飞,刘成宇,高涵.深度确定性策略梯度下运动目标识别及无人机跟随[J].西安工程大学学报,2024,38(4):9-17.
6吕茂隆,段海滨,杨任农,张群,万路军,陈希亮.无人机集群空中博弈对抗体系指挥控制模型[J].指挥与控制学报,2024,10(4):401-411.
7田鑫,倪世军,徐涛.现代战争智能化作战及安全通信保障[J].中国军转民,2024(20):35-37.

1韩尧,李少华.基于改进人工势场法的无人机航迹规划[J].系统工程与电子技术,2021,43(11):3305-3311. 被引量：37
2王小龙,孙冲,方群,李琪,宋硕.基于干扰观测器的航天器编队抓捕控制方法[J].西北工业大学学报,2021,39(5):1012-1021.
3陈仁祥,周君,胡小林,韩兴波,朱孙科,张晓.基于深度Q学习和连续小波变换的旋转机械故障诊断方法[J].振动工程学报,2021,34(5):1092-1100. 被引量：23
4Yiguo Yang,Liefa Liao,Hong Yang,Shuai Li.An Optimal Control Strategy for Multi-UAVs Target Tracking and Cooperative Competition[J].IEEE/CAA Journal of Automatica Sinica,2021,8(12):1931-1947. 被引量：8
5Zhi ZHENG,Shuncheng CAI.Acollaborative target tracking algorithm formultiple UAVs with inferior tracking capabilities[J].Frontiers of Information Technology & Electronic Engineering,2021,22(10):1334-1350. 被引量：4

飞行力学

2021年第5期

浏览历史

内容加载中请稍等...

基于APF-DQN的空战机动决策方法被引量：2

参考文献13

二级参考文献110

共引文献201

同被引文献93

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于APF-DQN的空战机动决策方法 被引量：2

参考文献13

二级参考文献110

共引文献201

同被引文献93

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于APF-DQN的空战机动决策方法被引量：2