期刊文献+

部分可观条件下空对地打击中的动态资源分配

Dynamic resources allocation for air-to-ground operations with partially observable outcomes
下载PDF
导出
摘要 针对静态分配模型的不足,基于部分可观的马尔可夫决策过程建立对单个目标的多阶段决策模型,以反映任务执行效果及反馈信息中的不确定性,进而提出对多个目标的动态资源分配模型。在离线优化阶段中,通过对偶分解法将其分解为一系列较易求解的子问题,并基于次梯度算法调整资源价格,以协调子问题所构造策略中资源的使用量。在实时决策中,根据所得策略及实际执行情况指定对目标的具体行动方案,确保约束条件得以满足。仿真结果表明了方法的有效性。 To overcome the limitations of static allocation models,the partially observable Markov decision processes(POMDP) based single target multi-stage decision model is proposed,which reflects the uncertainty in task execution and feedback information.Then,the model of dynamic resources allocation for multi-targets is put forward.The dual decomposition is used in off-line optimization processes to decouple the problem into POMDP sub-problems.The sub-gradients algorithm is used to offer the resources price so as to coordinate the resources consumption of policies constructed by sub-problems.In real-time decision,the actions for each target are selected base on the policies and execution states so as to satisfy the constraints.Simulation results illustrate the validity of the proposed method.
出处 《系统工程与电子技术》 EI CSCD 北大核心 2010年第9期1931-1936,共6页 Systems Engineering and Electronics
基金 国防基础科研项目(A2820080247)资助课题
关键词 智能系统 空对地打击 部分可观 动态分配 拉格朗日松弛 intelligent system air-to-ground attack partially observable dynamic allocation Lagrangian relaxation
  • 相关文献

参考文献10

二级参考文献46

共引文献157

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部