基于近似动态规划与零和博弈的空战机动决策被引量：3

Maneuver Decision of Air Combat Based on Approximate Dynamic Programming and Zero-sum Game

下载PDF

导出

摘要为应对机动策略未知的空中目标,针对以往机动决策建模通常存在"维数灾难"的不足,提出了一种结合近似动态规划与零和博弈的在线积分策略迭代算法。首先描述了近似动态规划存在问题及求解方法,提出了双人零和微分对策的近似动态规划算法,然后分析了博弈双方的均衡策略和在线策略迭代的求解方法,并结合空战应用场景设计了评价函数,最后进行了空战格斗的算例仿真。仿真结果表明,该算法通过运用函数逼近可以解决动态规划中难以处理的大规模模型"维数灾难"问题。 In order to against the aerial target with unknown maneuver strategy, an online integral policy iteration algorithm is proposed to consider the objections of the ancient air combat maneuver model with the ＂dimension curse＂ problem. First, the approximate dynamic programming （ADP） problems and its solving method are described, and the algorithm combining the ADP with the two player zero-sum differential game is presented. Then, the solution methods of the equilibrium strategy and on-line strategy iterative in both sides are analyzed. Design evaluation function based on air combat application scene, and carry out example simulation of air combat. The simulation results show that the algorithm uses the function approximation to deal with the large-scale ＂dimension curse＂ problem in dynamic programming.

作者梅丹刘锦涛高丽 Mei Dan Liu Jintao Gao Li(Qingdao Campus, Naval Aeronautical Engineering Institute, Qingdao 266041, China)

机构地区海军航空工程学院青岛校区

出处《兵工自动化》 2017年第3期35-39,共5页 Ordnance Industry Automation

关键词近似动态规划函数逼近空战决策零和博弈 approximate dynamic programming function approximation air combat decision zero-sum game

分类号 TP391.92 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1周思羽,吴文海,张楠,张靖.自主空战机动决策方法综述[J].航空计算技术,2012,42(1):27-31. 被引量：27
2钟麟,佟明安,钟卫,张圣云.多级影响图在空战机动决策中的应用[J].系统工程理论与实践,2006,26(10):137-140. 被引量：6
3梅丹,吴文海,徐家义.影响图的空战机动决策方法[J].火力与指挥控制,2008,33(S1):46-49. 被引量：6
4梅丹,吴文海,徐家义,王继武.决策影响图方法在三维空战决策中的应用[J].电光与控制,2008,15(2):66-69. 被引量：8
5周思羽,吴文海,孔繁峨,张楠.基于随机决策准则的改进多级影响图机动决策方法[J].北京理工大学学报,2013,33(3):296-301. 被引量：13
6周思羽,孔繁峨,吴文海,张楠,刘锦涛.基于变异离散粒子群的协同空战攻击决策算法[J].指挥控制与仿真,2012,34(4):25-29. 被引量：7

二级参考文献56

1王刚,雷英杰,何晶.空战决策指挥引导专家系统[J].空军工程大学学报（自然科学版）,2002,3(1):11-13. 被引量：15
2罗德林,沈春林,吴文海,吴顺祥.空战格斗决策研究[J].应用科学学报,2006,24(1):89-93. 被引量：13
3詹原瑞,何娟.树与影响图[J].系统工程理论与实践,1997,17(4):1-8. 被引量：8
4罗德林,王彪,龚华军,吴文海,沈春林.基于SAGA的协同多目标攻击决策[J].哈尔滨工业大学学报,2007,39(7):1154-1158. 被引量：14
5James S M.Real-time Maneuvering Decisions for Autono-mous Air Combat[D].Cambridge,Massachusetts:Massachu-setts Institute of Technology,2008.
6Virtanen K,Raivio T,Hamalainen R P.Decision Theoretical Approach to Pilot Simulation[J].Journal of Aircraft,1999,36(4):632-641.
7Isaacs R.Differential Games:A Mathematical Theory With Applications to Warfare and Pursuit,Control and Optimiza-tion[M].New York:Wiley,1965.
8Horie K,Conway B.Optimal Fighter Pursuit-evasion Maneu-vers Found Via Two-sided Optimization[J].Journal of Guid-ance,Control and Dynamics,2006,29(1):105-112.
9Raivio T.Capture Set Computation of an Optimally Guided Missile[J].Journal of Guidance,Control and Dynamics,2001,24(6):1167-1175.
10Ehtamo H,Raivio T.On Applied Nonlinear and Bilevel Pro-gramming for Pursuit-evasion Games[J].Journal of Optimi-zation Theory and Applications,2001,108(1):65-96.

共引文献57

1万伟,姜长生,吴庆宪.单步预测影响图法在空战机动决策中的应用[J].电光与控制,2009,16(7):13-16. 被引量：11
2孙永芹,孟上,代进进,范洪达.多机协同空战近距格斗决策[J].火力与指挥控制,2010,35(11):98-101. 被引量：3
3田旭光,朱元昌,邸彦强.军事指挥控制系统建模方法评述[J].指挥控制与仿真,2011,33(3):1-6. 被引量：3
4胡笑旋,杨善林,张强.支持群决策过程建模的层次影响图模型[J].系统工程理论与实践,2011,31(7):1312-1319. 被引量：5
5张立鹏,魏瑞轩,李霞.无人作战飞机空战自主战术决策方法研究[J].电光与控制,2012,19(2):92-96. 被引量：15
6吴文海,张楠,周思羽,孔繁峨,叶希贵.基于航炮的近距空战仿真结束判定方法[J].飞行力学,2012,30(6):569-573. 被引量：1
7潘寒尽,王威,邱学军,张欣.基于分布式计算的多机协同空战目标分配算法[J].电光与控制,2013,20(1):32-35. 被引量：1
8张楠,吴文海,周思羽,孔繁峨,叶希贵.群决策理论在多机协同空战机动决策中的应用[J].指挥控制与仿真,2013,35(1):23-26. 被引量：4
9付昭旺,李战武,强晓明,徐安.基于滚动时域控制的战斗机空战机动决策[J].电光与控制,2013,20(3):20-24. 被引量：14
10尹云飞,关海超,曾亚飞,王晓楠,孙天昊.飞行员动态行为评估方法[J].重庆大学学报（自然科学版）,2013,36(6):154-160. 被引量：3

同被引文献96

1钟麟,佟明安,钟卫,张圣云.基于影响图的空战机动决策模型[J].系统仿真学报,2007,19(8):1796-1798. 被引量：7
2Zhong Lin,Tong Ming'an,Zhong Wei,Zhang Shengyun.Sequential maneuvering decisions based on multi-stage influence diagram in air combat[J].Journal of Systems Engineering and Electronics,2007,18(3):551-555. 被引量：6
3钟友武,柳嘉润,杨凌宇,申功璋.自主近距空战中机动动作库及其综合控制系统[J].航空学报,2008,29(B05):114-121. 被引量：23
4张翔伦,杨蔷薇.基于机动动作库的实时轨迹生成与仿真研究[J].飞行力学,2008,26(3):29-32. 被引量：9
5李彦江,冯震宙,刘永寿.飞机燃油系统仿真分析研究[J].西安工业大学学报,2008,28(4):401-405. 被引量：14
6钟友武,杨凌宇,柳嘉润,申功璋.基于智能微分对策的自主机动决策方法研究[J].飞行力学,2008,26(6):29-33. 被引量：4
7陈军,高晓光,符小卫.基于粗糙集理论与贝叶斯网络的超视距空战战术决策[J].系统仿真学报,2009,21(6):1739-1742. 被引量：11
8崔松,韩裕生,朱守中.基于Stateflow/Simulink的末制导系统仿真[J].兵工自动化,2009,28(5):53-54. 被引量：3
9马耀飞,龚光红,彭晓源.基于强化学习的航空兵认知行为模型[J].北京航空航天大学学报,2010,36(4):379-383. 被引量：14
10刘正敏,昂亮,姜长生,吴庆宪.多级影响图在无人机群协同空战机动决策中的应用[J].电光与控制,2010,17(10):10-13. 被引量：10

引证文献3

1王旭明,于凤全,朱晓飞,瞿东辉.基于Simulink/Stateflow的某型战机燃油系统功能仿真[J].兵工自动化,2018,37(4):47-52. 被引量：2
2马文,李辉,王壮,黄志勇,吴昭欣,陈希亮.基于深度随机博弈的近距空战机动决策[J].系统工程与电子技术,2021,43(2):443-451. 被引量：21
3陈浩,黄健,刘权,周思航,张中杰.自主空战机动决策技术研究进展与展望[J].控制理论与应用,2023,40(12):2104-2129.

二级引证文献23

1谢文光,李琪,汪克念,马春燕,张涛,张国群.航空控制软件条件表达式故障分类及修复方法[J].西北工业大学学报,2020,38(4):862-872. 被引量：1
2王建鑫,江晶.基于远海突击任务的空中编队组建流程研究[J].科技资讯,2021,19(4):206-210.
3陈希亮,李清伟,孙彧.基于博弈对抗的空战智能决策关键技术[J].指挥信息系统与技术,2021,12(2):1-6. 被引量：8
4高昂,董志明,李亮,段莉,郭齐胜.面向LVC训练的蓝方虚拟实体近距空战决策建模[J].系统工程与电子技术,2021,43(6):1606-1617. 被引量：4
5张晓杰,周中良.基于APF-DQN的空战机动决策方法[J].飞行力学,2021,39(5):88-94. 被引量：2
6王盼盼,陈谋,吴庆宪,邵书义.基于经验直觉的无人机威胁规避机动决策方法[J].南京航空航天大学学报,2022,54(1):77-85.
7孔维仁,周德云,赵艺阳,杨婉莎.基于深度强化学习与自学习的多无人机近距空战机动策略生成算法[J].控制理论与应用,2022,39(2):352-362. 被引量：9
8许旭升,党朝辉,宋斌,袁秋帆,肖余之.基于多智能体强化学习的轨道追逃博弈方法[J].上海航天（中英文）,2022,39(2):24-31. 被引量：6
9唐文泉,孙莹,杨奇,李辉,王壮,何立.一种面向2V2近距空战的强化学习算法[J].战术导弹技术,2022(1):120-130. 被引量：1
10文东日.深度强化学习在军事领域的应用研究[J].军事运筹与评估,2022,37(3):75-80. 被引量：2

1赵琰,邓玮,张玉艳.基于近似动态规划的神经网络控制及在电力系统中应用[J].东北电力技术,2009,30(4):10-12. 被引量：1
2郑元春.容永康:云计算不是零和博弈[J].中国经济和信息化,2014,0(21):58-61.
3齐驰,王轶.交通流模型参数的近似动态规划辨识方法[J].控制与决策,2011,26(7):1091-1095. 被引量：1
4肖正,何青松,张世永.混合多Agent环境下动态策略强化学习算法[J].小型微型计算机系统,2009,30(7):1268-1273. 被引量：1
5徐安,于雷,寇英信,徐保伟,李战武.基于MDP框架的飞行器隐蔽接敌策略[J].系统工程与电子技术,2011,33(5):1063-1068. 被引量：11
6回响[J].数码时代,2013(6):23-23.
7孙思雨,孙良旭,苏晓磊,赵环宇.动态环境下基于近似动态规划的分布估计算法研究[J].电脑知识与技术,2014,10(10X):7173-7176. 被引量：1
8杨建涛.浅析网络中心战及其空战应用[J].硅谷,2010,3(8):44-45.
9黄海峰.云安全复杂度过高 360携伙伴发布新计划应对[J].通信世界,2016,0(23):53-53.
10刘德荣,李宏亮,王鼎.基于数据的自学习优化控制:研究进展与展望[J].自动化学报,2013,39(11):1858-1870. 被引量：22

兵工自动化

2017年第3期

浏览历史

内容加载中请稍等...

基于近似动态规划与零和博弈的空战机动决策被引量：3

参考文献6

二级参考文献56

共引文献57

同被引文献96

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于近似动态规划与零和博弈的空战机动决策 被引量：3

参考文献6

二级参考文献56

共引文献57

同被引文献96

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

基于近似动态规划与零和博弈的空战机动决策被引量：3