期刊文献+
共找到2,145篇文章
< 1 2 108 >
每页显示 20 50 100
空战用低价格昼夜合一头盔式显示器(HMD)
1
作者 Casey,CJ 陈映梅 《云光技术》 2000年第4期30-34,共5页
当代理想对现代战场环境无论是边远地区还是城区都提出24小时全天作战的要求。迄今为止,夜视头盔(NVGs)与红外传感器一起为机组人员提供了主要的观测手段,使他们能投入到低能见度的夜间战斗中。
关键词 昼夜合一头盔式显示器 空战用 低价格
下载PDF
无人空战指控建模仿真方法研究 被引量:3
2
作者 李耀宇 金帅 +1 位作者 马满好 任伟 《指挥控制与仿真》 2024年第1期85-92,共8页
针对当前无人空战仿真中,缺乏支持全流程作战指挥控制建模与仿真这一问题,结合当前无人空战仿真系统相关研究,系统梳理和研究指控模型构建方法,通过探索不同仿真层级不同类型的无人机指挥控制建模原理和方法,设计并且构建了一套适合指... 针对当前无人空战仿真中,缺乏支持全流程作战指挥控制建模与仿真这一问题,结合当前无人空战仿真系统相关研究,系统梳理和研究指控模型构建方法,通过探索不同仿真层级不同类型的无人机指挥控制建模原理和方法,设计并且构建了一套适合指挥信息系统装备特点的指控模型仿真系统。通过进行符合预设约束的想定设定,对目标作战任务进行了效能评估和对比,可为无人空战相关指挥信息系统装备的论证、评估方式提供理论和现实指导。 展开更多
关键词 无人空战 指挥控制 仿真评估
下载PDF
基于改进支持向量回归的空战飞行动作识别 被引量:1
3
作者 刘庆利 李蕊 乔晨昊 《现代防御技术》 北大核心 2024年第1期49-56,共8页
针对空战中飞机的飞行动作愈发复杂导致识别准确率低的问题,提出了改进支持向量回归的空战飞行动作识别方法,该方法采用高斯核函数作为线性核函数,利用混沌初始化和反向学习策略改进麻雀搜索算法,利用改进后的麻雀算法优化支持向量回归... 针对空战中飞机的飞行动作愈发复杂导致识别准确率低的问题,提出了改进支持向量回归的空战飞行动作识别方法,该方法采用高斯核函数作为线性核函数,利用混沌初始化和反向学习策略改进麻雀搜索算法,利用改进后的麻雀算法优化支持向量回归算法,具体表现为对支持向量回归算法中高斯核函数的参数进行优化,通过优化后的支持向量回归算法进行飞机动作识别。采用了五种基本的飞行动作和几种复杂的飞行动作验证该方法的识别准确率。仿真表明,优化后的支持向量回归算法与传统的支持向量回归算法、模糊支持向量机算法、传统聚类算法、神经网络算法相比,对基本飞行动作的平均识别率至少提升了2.2%,对复杂飞行动作的平均识别率至少提升了3.7%。 展开更多
关键词 空战 支持向量回归 强化麻雀搜索算法 飞行动作识别 复杂动作
下载PDF
基于改进近端策略优化的空战自主决策研究
4
作者 钱殿伟 齐红敏 +2 位作者 刘振 周志明 易建强 《系统仿真学报》 CAS CSCD 北大核心 2024年第9期2208-2218,共11页
针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影... 针对传统强化学习在空战自主决策应用中信息冗余度高、收敛速度慢等问题,提出一种基于双重观测与复合奖励的近端策略优化空战自主决策算法。设计了以交互信息为主、个体特征信息为辅的双重观测信息,降低战场信息高度冗余对训练效率的影响;设计了结果奖励和过程奖励相结合的复合奖励函数,提高了训练过程收敛速度;采用广义优势函数估计,改进了近端策略优化算法,提高优势函数估计的准确性。仿真结果表明:在对战固定程控对手和矩阵博弈对手实验场景中,该算法决策模型均可根据战场态势准确进行自主决策,完成空战任务。 展开更多
关键词 强化学习 空战自主决策 双重观测 复合奖励 广义优势函数估计
下载PDF
空战目标轨迹预测技术研究综述
5
作者 郭正玉 刘浩宇 苏雨 《航空兵器》 CSCD 北大核心 2024年第2期32-43,共12页
信息化空战对抗中,快速获取和有效利用对手信息的一方,能够准确地预测对手的运动轨迹,更加迅速地完成OODA循环,进而取得空战优势。本文研究空战目标轨迹预测技术,以时序变化特征为研究视角,分别对基于物理、机器学习和深度学习的轨迹预... 信息化空战对抗中,快速获取和有效利用对手信息的一方,能够准确地预测对手的运动轨迹,更加迅速地完成OODA循环,进而取得空战优势。本文研究空战目标轨迹预测技术,以时序变化特征为研究视角,分别对基于物理、机器学习和深度学习的轨迹预测技术开展分析和总结,进一步归纳物理因素、空战因素和交互因素等作为轨迹预测模型的输入,单模态轨迹、多模态轨迹和行为意图三类作为模型的输出,并对未来智能化空战中的目标轨迹预测技术进行展望。 展开更多
关键词 信息化空战 OODA循环 目标轨迹预测 空战对抗 机动决策
下载PDF
有人/无人机协同空战研究进展综述 被引量:1
6
作者 王菡 梁晓龙 +1 位作者 王宁 张佳强 《电光与控制》 CSCD 北大核心 2024年第5期11-17,53,共8页
有人/无人机协同空战是未来空战的重要发展方向,有人机和无人机协同运用、优势互补,形成灵活高效的作战体系,将对未来空战效能的提升发挥巨大作用。首先,阐述了近年来美军作战概念的发展演进,分析了美军有人/无人机协同作战的相关项目发... 有人/无人机协同空战是未来空战的重要发展方向,有人机和无人机协同运用、优势互补,形成灵活高效的作战体系,将对未来空战效能的提升发挥巨大作用。首先,阐述了近年来美军作战概念的发展演进,分析了美军有人/无人机协同作战的相关项目发展,提炼总结了有人/无人机协同空战的特点;其次,以穿透性制空作战为场景,分析了有人/无人机协同空战的具体运用和作战流程;最后,从航迹规划、空战决策、编队控制3个方面对有人/无人机协同空战的关键技术和研究现状进行梳理和分析,并对未来有人/无人机协同空战的研究发展方向进行了总结和展望。 展开更多
关键词 有人/无人机协同 协同空战 概念演变 关键技术
下载PDF
基于图卷积深度强化学习的协同空战机动决策方法 被引量:1
7
作者 欧洋 郭正玉 +1 位作者 罗德林 缪克华 《工程科学学报》 EI CSCD 北大核心 2024年第7期1227-1236,共10页
针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的... 针对多无人机智能协同空战对抗决策问题,提出了一种基于长短期记忆与竞争图卷积深度强化学习的多机协同空战机动对抗决策方法.首先,对多机协同空战对抗问题进行描述;其次,在竞争Q网络中,引入长短期记忆网络用于处理带有强时序相关性的空战信息,接着,搭建图卷积网络作为多机之间的通信基础,提出基于长短期记忆与竞争图卷积深度强化学习算法的协同空战训练框架,并对协同空战决策训练算法进行了设计.二对一空战仿真结果验证了本文所提出的协同智能对抗决策方法的有效性,其具有决策速度快、学习过程稳定的特点以及适应空战环境快速变化下的协同策略学习能力. 展开更多
关键词 无人机 深度强化学习 机动决策 多机协同 空战决策
下载PDF
稀疏奖励下基于课程学习的无人机空战仿真 被引量:1
8
作者 祝靖宇 张宏立 +4 位作者 匡敏驰 史恒 朱纪洪 乔直 周文卿 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1452-1467,共16页
针对传统强化学习在空战环境下探索能力差和奖励稀疏的问题,提出了一种基于课程学习的分布式近端策略优化(curriculum learning distributed proximal policy optimization,CLDPPO)强化学习算法。嵌入包含专家经验知识的奖励函数,设计... 针对传统强化学习在空战环境下探索能力差和奖励稀疏的问题,提出了一种基于课程学习的分布式近端策略优化(curriculum learning distributed proximal policy optimization,CLDPPO)强化学习算法。嵌入包含专家经验知识的奖励函数,设计了离散化的动作空间,构建了局部观测与全局观测分离的演员评论家网络。通过为无人机制定进攻、防御以及综合课程,让无人机从基本课程由浅入深开始学习作战技能,阶段性提升无人机作战能力。实验结果表明:以课程学习方式训练的无人机能以一定的优势击败专家系统和主流强化学习算法,同时具有空战战术的自我学习能力,有效改善稀疏奖励的问题。 展开更多
关键词 UAVS 空战 稀疏奖励 课程学习 分布式近端策略优化
下载PDF
智能空战深度强化决策方法现状与展望
9
作者 张烨 涂远刚 +2 位作者 张良 崔颢 王靖宇 《航空兵器》 CSCD 北大核心 2024年第3期21-31,共11页
本文聚焦于现代智能空战决策技术的发展需求,分析了智能空战场景的要素与特点,介绍了现有智能空战决策理论的研究现状,包括基于博弈理论的决策方法、先验数据驱动的决策方法、基于自主学习的决策方法,着重梳理了基于价值和基于策略的深... 本文聚焦于现代智能空战决策技术的发展需求,分析了智能空战场景的要素与特点,介绍了现有智能空战决策理论的研究现状,包括基于博弈理论的决策方法、先验数据驱动的决策方法、基于自主学习的决策方法,着重梳理了基于价值和基于策略的深度强化学习智能决策方法。最后,面向未来智能空战面临的各种挑战以及传统深度强化学习的局限性,展望了深度强化学习技术在空战领域的发展方向:面向集群作战的多体智能决策技术、面向广域时空的高效智能决策技术、面向复杂场景的泛化智能决策技术。 展开更多
关键词 空战决策 人工智能 强化学习 智能博弈 集群作战 深度学习
下载PDF
基于一种改进PPO算法的无人机空战自主机动决策方法研究
10
作者 张欣 董文瀚 +3 位作者 尹晖 贺磊 张聘 李敦旺 《空军工程大学学报》 CSCD 北大核心 2024年第6期77-86,共10页
深度强化学习的应用为无人机自主机动决策提供了新的可能。提出一种基于态势评估模型重构与近端策略优化(PPO)算法相结合的无人机自主空战机动决策方法,为一对一近距空战提供了有效策略选择。首先,建立高保真六自由度无人机模型与近距... 深度强化学习的应用为无人机自主机动决策提供了新的可能。提出一种基于态势评估模型重构与近端策略优化(PPO)算法相结合的无人机自主空战机动决策方法,为一对一近距空战提供了有效策略选择。首先,建立高保真六自由度无人机模型与近距空战攻击模型;其次,基于空战状态划分重构角度、速度、距离和高度态势函数,提出一种描述机动潜力的新型态势评估指标;之后,基于态势函数设计塑形奖励,并与基于规则的稀疏奖励、基于状态转换的子目标奖励共同构成算法奖励函数,增强了强化学习算法的引导能力;最后,设计专家系统作为对手,在高保真空战仿真平台(JSBSim)中对本文工作进行了评估。仿真验证,应用本文方法的智能体在对抗固定机动对手与专家系统对手时算法收敛速度与胜率都得到了有效提升。 展开更多
关键词 PPO算法 机动潜力 六自由度飞机模型 态势函数 近距空战 专家系统
下载PDF
基于有限忍耐度鸽群优化的无人机近距空战机动决策
11
作者 郑志强 段海滨 《计算机应用》 CSCD 北大核心 2024年第5期1401-1407,共7页
由于对抗双方态势的快速变化,无人机近距空战机动自主决策困难且复杂,是空中对抗的一个难点。对此,提出一种基于有限忍耐度鸽群优化(FTPIO)算法的无人机近距空战机动决策方法。该方法主要包括基于机动动作库的对手行动预测和基于FTPIO... 由于对抗双方态势的快速变化,无人机近距空战机动自主决策困难且复杂,是空中对抗的一个难点。对此,提出一种基于有限忍耐度鸽群优化(FTPIO)算法的无人机近距空战机动决策方法。该方法主要包括基于机动动作库的对手行动预测和基于FTPIO算法的机动控制量和执行时间优化求解两个部分。为提升基本鸽群优化(PIO)算法的全局探索能力,引入有限忍耐度策略,在鸽子个体几次迭代中没有找到更优解时对其属性进行一次重置,避免陷入局部最优陷阱。该方法采用的优化变量是无人机运动模型控制变量的增量,打破了机动库的限制。通过和极小极大方法、基本PIO算法和粒子群优化(PSO)算法的仿真对抗测试结果表明,所提出的机动决策方法能够在近距空战中有效击败对手,产生更为灵活的欺骗性机动行为。 展开更多
关键词 鸽群优化算法 近距空战 机动决策 无人机 有限忍耐度策略
下载PDF
基于兵棋推演的空战编组对抗智能决策方法
12
作者 陈晓轩 冯旸赫 +2 位作者 黄金才 刘忠 徐越 《指挥与控制学报》 CSCD 北大核心 2024年第2期213-219,共7页
基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大... 基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大时,算法收敛慢,且对仿真平台有较高的要求。针对上述问题,提出了一种融合知识数据和强化学习的空战编组对抗智能决策方法,该决策方法的输入是战场融合态势,使用分层决策框架控制算子选择并执行任务,上层包含使用专家知识驱动的动作选择器,下层包含使用专家知识和作战规则细化的避弹动作执行器、侦察动作执行器和使用强化学习算法控制的打击动作执行器。最后基于典型作战场景进行实验,验证了该方法的可行性和实用性,且具有建模准确、训练高效的优点。 展开更多
关键词 空战编组对抗 多算子的协作与控制 多智能体深度强化学习算法 分层决策模型
下载PDF
基于强化学习的智能空战模型研究
13
作者 李佳桐 卢俊元 +1 位作者 王光耀 李建勋 《指挥控制与仿真》 2024年第4期35-43,共9页
人工智能的进步深刻改变了各行各业,智能空战就是其中的典型代表之一。根据空战游戏的特点,构建了智能空战模型,主要包括样本集合的获取以及适用于空战决策的网络模型选择。结合空战连续状态、连续动作、现有战术动作等的特点,通过对比... 人工智能的进步深刻改变了各行各业,智能空战就是其中的典型代表之一。根据空战游戏的特点,构建了智能空战模型,主要包括样本集合的获取以及适用于空战决策的网络模型选择。结合空战连续状态、连续动作、现有战术动作等的特点,通过对比多个智能学习网络模型,选择DQN算法作为智能空战的模型,同时借助飞行模拟游戏DCS,采取与游戏内自带敌人对战的方式进行动态交互训练,得到能够在一定程度上操作战机作战的模型与具有参考价值的空战案例,通过对这些案例的分析,形成了胜/负/平局三类样本数据集。仿真结果表明,本文所构建的智能空战模型不仅有助于生成新的对策案例样本,而且有助于丰富空战战术。 展开更多
关键词 空战 强化学习 飞行模拟游戏
下载PDF
基于深度强化学习的多无人机空战机动策略研究 被引量:1
14
作者 雷毅飞 王露禾 +4 位作者 贺泊茗 胡劲文 徐钊 吕明伟 徐港 《航空科学技术》 2024年第3期111-118,共8页
面对敌方空中力量的来袭,具有自主协同、灵活机动能力的无人机是参与空中作战的重要力量。面向多无人机协同高制胜率的对抗作战任务需求,并根据空战目标数量划分,重点对多无人机对单目标协同空战机动策略和多无人机对多目标协同空战机... 面对敌方空中力量的来袭,具有自主协同、灵活机动能力的无人机是参与空中作战的重要力量。面向多无人机协同高制胜率的对抗作战任务需求,并根据空战目标数量划分,重点对多无人机对单目标协同空战机动策略和多无人机对多目标协同空战机动策略展开研究。本文主要分析了空战过程中的关键战场要素,基于多机机动特性,建立无人机运动模型。根据无人机火控特点,分析无人机状态变化规律,建立无人机对敌攻击模型和动态对抗模型;针对多无人机对单目标自主协同空战问题,提出基于专家规则和强化学习相结合的多机自主机动策略。仿真结果表明,所提算法可以完成态势实时变化的多机对单目标空战任务。在作战双方数量相同的前提下,若敌方不具备智能机动行为,我方制胜率为100%;即使双方采用相同的策略,如果我方数量多于敌方数量,我方仍有大的胜率,体现了协同策略的有效性。 展开更多
关键词 空战策略 强化学习 自主机动 多机协同 态势评估
下载PDF
基于深度强化学习的抗感知误差空战机动决策
15
作者 田成滨 李辉 +1 位作者 陈希亮 吴冯国 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第6期270-282,共13页
在视距内空战机动决策中,以光电传感器和雷达为代表的机载感知设备易受敌方干扰或气象因素等影响,产生态势感知误差。深度强化学习(DRL)在空战机动决策中虽已取得了重要进展,但现有方法并未考虑空战态势感知误差对DRL的影响。由于状态... 在视距内空战机动决策中,以光电传感器和雷达为代表的机载感知设备易受敌方干扰或气象因素等影响,产生态势感知误差。深度强化学习(DRL)在空战机动决策中虽已取得了重要进展,但现有方法并未考虑空战态势感知误差对DRL的影响。由于状态空间是连续且高维的,态势感知误差会影响状态估计的精度和准确性,进而影响DRL的训练速度及决策效果。针对上述问题,提出一种基于门控循环单元(GRU)提取态势特征的近端策略优化算法(GPPO)。首先,在近端策略优化算法(PPO)基础上引入门控循环单元来融合前序态势信息,提取连续态势序列之间的隐藏特征。随后,通过优势态势解算单元压缩DRL的状态空间维度,从而降低训练难度,并设计一种量化优势的奖励塑造(RS)方法来引导DRL训练加速收敛。最后,定义并描述了视距内空战的相对态势模型,通过设计和引入态势感知误差量,搭建具备态势感知误差的空战仿真环境,并在不同感知误差强度及不同敌我初始态势等多种场景下进行仿真对比实验。仿真结果表明:GPPO算法在具备态势感知误差的多种视距内空战场景里均能有效完成空战优势机动决策,使用GPPO和量化优势RS方法的模型训练收敛速度和机动决策性能均显著优于基础强化学习算法,有效提高了无人机面对态势感知误差时的空战机动决策能力。 展开更多
关键词 深度强化学习 视距内空战 机动决策 感知误差 奖励塑造 无人机
下载PDF
有人/无人机协同空战任务规划技术
16
作者 赵拓 张先剑 黄健 《火力与指挥控制》 CSCD 北大核心 2024年第2期1-10,共10页
随着“分布式作战”“马赛克战”等新型作战概念的提出,无人机作为新型空战力量,依靠其灵活性、机动性、互操作性和低廉的成本,有效地弥补了有人机在空战中的作战“盲区”,将其纳入现代空战的任务规划体系,与有人机协同配合执行空战任务... 随着“分布式作战”“马赛克战”等新型作战概念的提出,无人机作为新型空战力量,依靠其灵活性、机动性、互操作性和低廉的成本,有效地弥补了有人机在空战中的作战“盲区”,将其纳入现代空战的任务规划体系,与有人机协同配合执行空战任务,会对空战结果产生巨大的影响。研究了基于数据的空战离线任务规划技术和基于任务的空战在线任务规划技术,并基于OODA环对有人/无人机协同空战任务规划技术进行了综述,结合该技术在测试进程和实际作战应用中存在的不足,展望了该技术未来的发展趋势,对下一步开展有人/无人机协同空战任务规划研究提供借鉴参考。 展开更多
关键词 有人机 无人机 协同空战 任务规划
下载PDF
基于改进能量谷优化的多无人机空战目标分配
17
作者 张嘉辉 蒙志君 +2 位作者 何家政 王子琛 林尤深 《系统工程与电子技术》 EI CSCD 北大核心 2024年第11期3754-3763,共10页
针对多无人机空战目标分配问题,提出一种基于改进能量谷优化的多无人机空战目标分配方法。首先,建立无人机空战态势评估模型,对多无人机空战目标分配问题进行数学建模。然后,在能量谷优化算法的基础上,对算法中粒子衰变过程进行改进,使... 针对多无人机空战目标分配问题,提出一种基于改进能量谷优化的多无人机空战目标分配方法。首先,建立无人机空战态势评估模型,对多无人机空战目标分配问题进行数学建模。然后,在能量谷优化算法的基础上,对算法中粒子衰变过程进行改进,使能量谷优化算法适用于离散型优化问题,并提出混沌映射初始化和二进制改进两种改进措施。最后,分别开展消融实验与有效性实验对所提方法的有效性进行验证。仿真结果表明,所提改进措施对于在无人机目标分配任务中能量谷优化算法的算法效果具有一定的提升,且改进能量谷优化算法能够适用于多无人机空战目标分配问题,在多无人机空战中具有一定的应用意义。 展开更多
关键词 多无人机空战 目标分配 能量谷优化 态势评估
下载PDF
面向空战仿真的智能对手建模研究进展与展望
18
作者 郭亚楠 曹小群 +1 位作者 杨术 周晓光 《火力与指挥控制》 CSCD 北大核心 2024年第5期1-8,17,共9页
智能对手建模是空战仿真领域的重要课题,对于加快空战模拟训练的转型升级,提高训练效益、节约训练成本、降低训练风险等方面具有重要意义。总结了近年来国外智能对手建模技术研究进展;论述了智能对手能力需求与关键技术,分别对智能对手... 智能对手建模是空战仿真领域的重要课题,对于加快空战模拟训练的转型升级,提高训练效益、节约训练成本、降低训练风险等方面具有重要意义。总结了近年来国外智能对手建模技术研究进展;论述了智能对手能力需求与关键技术,分别对智能对手对抗空间表示与建模、态势评估与推理、智能对手自主决策与优化、多智能对手行动协同与控制进行分析。对未来空战智能对手建模技术的发展方向进行了总结和展望,以期为相关研究人员提供参考与启发。 展开更多
关键词 空战 模拟训练 对手建模 人工智能
下载PDF
近距空战中目标飞机战术机动数学模型建模与仿真
19
作者 杜瑾 邹坤 张义飞 《现代电子技术》 北大核心 2024年第5期29-34,共6页
作为空空导弹设计与验证的主要手段,数字仿真技术在制导系统性能评估、抗干扰性能评估、空战对抗仿真等领域发挥着重要的作用。为解决空空导弹数字仿真试验中目标飞机机动样式单一,不能反映近距格斗过程中目标姿态的变化问题,梳理了飞... 作为空空导弹设计与验证的主要手段,数字仿真技术在制导系统性能评估、抗干扰性能评估、空战对抗仿真等领域发挥着重要的作用。为解决空空导弹数字仿真试验中目标飞机机动样式单一,不能反映近距格斗过程中目标姿态的变化问题,梳理了飞机机动数学模型在导弹总体性能评估与对抗推演等方面的应用背景需求。对六自由度飞机机动简化数学模型的建设进行了分析和论证。构建了飞机作战典型机动动作库、机动动作指令生成器,实现了以较少的参数刻画不同的机动动作。在三自由度质点运动模型基础上,考虑机动过载、目标攻角、横滚角变化,建立目标机动数学模型。根据所建模型,对几种典型机动教学模型进行数字仿真。仿真结果表明,目标机动轨迹与预期吻合,能够满足导弹总体设计、对抗推演对数字仿真的需求。 展开更多
关键词 性能评估 近距空战 数字仿真 建模 机动动作库 动力学 姿态角 轨迹
下载PDF
基于态势评估及DDPG算法的一对一空战格斗控制方法
20
作者 贺宝记 白林亭 文鹏程 《航空工程进展》 CSCD 2024年第2期179-187,共9页
已有的空中格斗控制方法未综合考虑基于专家知识的态势评估及通过连续性速度变化控制空战格斗的问题。基于深度确定性策略梯度(DDPG)强化学习算法,在态势评估函数作为强化学习奖励函数的基础上,设计综合考虑飞行高度上下限、飞行过载以... 已有的空中格斗控制方法未综合考虑基于专家知识的态势评估及通过连续性速度变化控制空战格斗的问题。基于深度确定性策略梯度(DDPG)强化学习算法,在态势评估函数作为强化学习奖励函数的基础上,设计综合考虑飞行高度上下限、飞行过载以及飞行速度上下限的强化学习环境;通过全连接的载机速度控制网络与环境奖励网络,实现DDPG算法与学习环境的交互,并根据高度与速度异常、被导弹锁定时间以及格斗时间设计空战格斗结束条件;通过模拟一对一空战格斗,对该格斗控制方法在环境限制学习、态势评估得分以及格斗模式学习进行验证。结果表明:本文提出的空战格斗控制方法有效,能够为自主空战格斗进一步发展提供指导。 展开更多
关键词 强化学习 态势评估 深度确定性策略梯度 空战格斗
下载PDF
上一页 1 2 108 下一页 到第
使用帮助 返回顶部