期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的智能对手自主空战决策技术
1
作者 杨凯达 杨兴昊 刘钊 《火力与指挥控制》 CSCD 北大核心 2023年第10期27-33,共7页
为提升空战训练对手的智能性与自主性,提升空战训练效果。针对空战战术训练智能对手自主空战决策问题,提出一种基于深度强化学习的智能体训练方法,采用最大熵强化学习(SAC)算法平衡策略探索与利用的优势,引入自博弈和多智能体联盟训练... 为提升空战训练对手的智能性与自主性,提升空战训练效果。针对空战战术训练智能对手自主空战决策问题,提出一种基于深度强化学习的智能体训练方法,采用最大熵强化学习(SAC)算法平衡策略探索与利用的优势,引入自博弈和多智能体联盟训练方法提升空战智能体策略的多样性和鲁棒性。针对一对一近距格斗空战场景建立智能博弈框架及奖励函数,仿真结果表明,基于零经验训练得到的智能体能够有效自主机动决策并实施近距导弹攻击,产生较好的战术效果,证明该方法在一对一近距格斗空战智能体训练中的有效性。 展开更多
关键词 自主空战决策 智能对手 强化学习 SAC
下载PDF
近距空战训练中的智能虚拟对手决策与导引方法 被引量:4
2
作者 孟光磊 刘德见 +2 位作者 周铭哲 朴海音 陈耀飞 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第6期937-949,共13页
针对近距空战训练中智能虚拟对手攻防博弈的自主决策与占位导引问题,提出了基于动态贝叶斯网络(DBN)和约束梯度法的智能虚拟对手决策和导引一体化方法。结合空间占位态势、火控攻击区和机动动作识别结果等信息,建立近距空战决策动态贝... 针对近距空战训练中智能虚拟对手攻防博弈的自主决策与占位导引问题,提出了基于动态贝叶斯网络(DBN)和约束梯度法的智能虚拟对手决策和导引一体化方法。结合空间占位态势、火控攻击区和机动动作识别结果等信息,建立近距空战决策动态贝叶斯网络模型,实现根据战场动态环境变化的占位导引指标决策。针对在线识别的各类目标机动动作,建立轨迹预测模型,实现目标轨迹的实时预测。根据占位导引指标和目标预测轨迹,考虑飞行性能约束,采用约束梯度法计算智能虚拟对手的优化占位导引量。实现了近距空战智能虚拟对手空间占位决策与导引量计算的无缝结合。近距空战仿真实验结果表明:所提方法能够实现智能虚拟对手的合理化自主决策和占位导引,克服了传统方法实现机动动作方式固化的问题,具备较好的实时性和优化性。 展开更多
关键词 空战训练 智能虚拟对手 占位导引 机动识别 轨迹预测 动态贝叶斯网络(DBN)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部