部分可观条件下空对地打击中的动态资源分配

Dynamic resources allocation for air-to-ground operations with partially observable outcomes

下载PDF

导出

摘要针对静态分配模型的不足,基于部分可观的马尔可夫决策过程建立对单个目标的多阶段决策模型,以反映任务执行效果及反馈信息中的不确定性,进而提出对多个目标的动态资源分配模型。在离线优化阶段中,通过对偶分解法将其分解为一系列较易求解的子问题,并基于次梯度算法调整资源价格,以协调子问题所构造策略中资源的使用量。在实时决策中,根据所得策略及实际执行情况指定对目标的具体行动方案,确保约束条件得以满足。仿真结果表明了方法的有效性。 To overcome the limitations of static allocation models,the partially observable Markov decision processes（POMDP） based single target multi-stage decision model is proposed,which reflects the uncertainty in task execution and feedback information.Then,the model of dynamic resources allocation for multi-targets is put forward.The dual decomposition is used in off-line optimization processes to decouple the problem into POMDP sub-problems.The sub-gradients algorithm is used to offer the resources price so as to coordinate the resources consumption of policies constructed by sub-problems.In real-time decision,the actions for each target are selected base on the policies and execution states so as to satisfy the constraints.Simulation results illustrate the validity of the proposed method.

作者李远苏菲朱华勇沈林成

机构地区国防科学技术大学机电工程与自动化学院

出处《系统工程与电子技术》 EI CSCD 北大核心 2010年第9期1931-1936,共6页 Systems Engineering and Electronics

基金国防基础科研项目(A2820080247)资助课题

关键词智能系统空对地打击部分可观动态分配拉格朗日松弛 intelligent system air-to-ground attack partially observable dynamic allocation Lagrangian relaxation

分类号 TP273.5 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献10

1陈华东,王树宗,王航宇.基于混合粒子群算法的多平台多武器火力分配研究[J].系统工程与电子技术,2008,30(5):880-883. 被引量：34
2王小艺,侯朝桢,原菊梅,郭飞,郝伟.防空火力分配建模及优化方法研究[J].控制与决策,2006,21(8):913-917. 被引量：24
3沈阳,陈永光,李修和.基于0-1规划的雷达干扰资源优化分配研究[J].兵工学报,2007,28(5):528-532. 被引量：46
4Wacholder E.A neural network-based optimization algorithm for the static weapon assignment problem[J].ORSA Journal on Computing,1989,1(4):232-246.
5Galatic D G.Game theoretic target assignment strategies in competitive multi-team systems[D].Pittsburgh:University of Pittsburgh,2004.
6王玮,程树昌,张玉芝.基于遗传算法的一类武器目标分配方法研究[J].系统工程与电子技术,2008,30(9):1708-1711. 被引量：53
7杜天军,陈光,刘占辰.多目标攻击空战决策WBG模型及其蚁群算法[J].系统工程与电子技术,2005,27(5):861-865. 被引量：15
8Cassandra A R.Exact and approximate algorithms for Markov decision processes[D].Providence:Brown University,1998.
9Fisher M L.The lagrangian relaxation method for solving integer programming problems[J].Management Science,1981,27(1):1-18.
10Cheng H T.Algorithms for partially observable Markov decision processes[D].British Columbia:University of British Columbia,1988.

二级参考文献46

1陈华东,朱建冲,王树宗.遗传算法在制导武器火力精确分配中的应用[J].火力与指挥控制,2004,29(z1):92-94. 被引量：4
2李明.基于仿真模型与遗传算法的最优火力分配模型[J].军事运筹与系统工程,2005,19(4):45-47. 被引量：6
3解春明,李德胜,杨传春,李永波.地地导弹突击目标火力分配模型分析[J].军事运筹与系统工程,2004,18(1):29-32. 被引量：5
4陈绍顺,王颖龙,王君.多武器系统的火力分配模型[J].电光与控制,2004,11(3):5-7. 被引量：6
5黄树采,李为民.目标分配问题的蚁群算法研究[J].系统工程与电子技术,2005,27(1):79-80. 被引量：41
6陈绍顺,王颖龙,王君.多武器系统的火力分配模型[J].火力与指挥控制,2005,30(2):45-47. 被引量：7
7高尚,杨静宇.武器-目标分配问题的粒子群优化算法[J].系统工程与电子技术,2005,27(7):1250-1252. 被引量：55
8王小艺,侯朝桢,原菊梅,郭飞,郝伟.防空火力分配建模及优化方法研究[J].控制与决策,2006,21(8):913-917. 被引量：24
9丁铸,马大为,汤铭端,张学锋.基于禁忌退火粒子群算法的火力分配[J].系统仿真学报,2006,18(9):2480-2483. 被引量：26
10李志刚,吴沧浦.递阶算法在大规模火力规划问题求解中的应用[J].兵工学报,1997,18(1):52-55. 被引量：3

共引文献157

1孙永芹,马响玲,叶文,范洪达.超视距多机协同多目标攻击系统研究[J].系统仿真学报,2008,20(8):2161-2164. 被引量：6
2陈华东,王树宗,王航宇.基于混合粒子群算法的多平台多武器火力分配研究[J].系统工程与电子技术,2008,30(5):880-883. 被引量：34
3鲁华,周德云.基于模糊多因素的对地多目标攻击战术规划研究[J].计算机工程与应用,2008,44(18):227-229. 被引量：3
4郭辉,徐浩军,刘凌,孟捷.基于LINGO的多目标攻击空战决策研究[J].系统仿真学报,2009,21(16):5244-5246. 被引量：1
5刘以安,倪天权,张秀辉,李游.模拟退火算法在雷达干扰资源优化分配中的应用[J].系统工程与电子技术,2009,31(8):1914-1917. 被引量：36
6黄绪发,郝威.一种基于Chirp探测的短波频率分配算法[J].信息通信,2009,22(4):21-23. 被引量：4
7阮旻智,王红军,李庆民,于志良,杜鹃.基于最小干扰距离的多点源支援干扰效果评估[J].系统工程与电子技术,2009,31(9):2110-2113. 被引量：7
8王正元,严小琴.基于仿真的武器—目标分配问题求解方法[J].系统仿真学报,2009,21(20):6597-6599. 被引量：5
9易咸煜,孙闽红,唐斌.基于TOPSIS法的雷达抗干扰措施优化选取[J].现代雷达,2009,31(10):35-37. 被引量：7
10易咸煜,孙闽红,唐斌.基于1-1原则的雷达抗干扰措施优化选取[J].数据采集与处理,2009,24(B10):8-10. 被引量：3

1孙燕,武书彦,刘久富,刘文渊,刘海洋,杨忠.高铁进出站控制系统的Petri网故障诊断研究[J].广西大学学报（自然科学版）,2016,41(2):535-540. 被引量：3
2刘久富,刘文良,周建勇,刘海阳,王志胜,刘春生.改进的部分可观Petri网系统在线故障诊断器设计[J].控制理论与应用,2015,32(7):866-872. 被引量：6
3声音[J].中国电力企业管理,2009(11):5-5.
4韩金舫,桑琳,储毅.模糊控制中隶属函数的构造策略[J].交通与计算机,2001,19(6):11-13. 被引量：6
5朱上俭.二叉树的线索迂回链表[J].北京工业大学学报,1996,22(2):105-110.
6侯秀红,董峰.Visual Basic 6.0中正则表达式的应用[J].郑州轻工业学院学报（自然科学版）,2005,20(4):38-41. 被引量：1
7李伟华,王备战,李书书.实时软件测试用例构造方法研究[J].西北工业大学学报,1998,16(2):261-265. 被引量：2
8张文斗,陈璟,王楠,谷学强.基于有限状态机的武器投放航迹仿真研究[J].微计算机信息,2010,26(28):150-152.
9方欢,陆阳,岳峰,官骏鸣.实现故障无二义诊断的部分可观系统设计方法[J].系统仿真学报,2015,27(3):470-479.
10羊秋玲,李陶深,葛志辉.基于时延约束的无线Mesh网络信道容量分析模型[J].微计算机信息,2010,26(36):115-116. 被引量：1

系统工程与电子技术

2010年第9期

浏览历史

内容加载中请稍等...

部分可观条件下空对地打击中的动态资源分配

参考文献10

二级参考文献46

共引文献157

相关作者

相关机构

相关主题

浏览历史