-
题名基于MATD3的视距内协同空战机动决策
被引量:3
- 1
-
-
作者
张栋
唐俊林
熊威
任智
杨书恒
-
机构
西北工业大学航天学院
-
出处
《航空兵器》
CSCD
北大核心
2023年第3期20-28,共9页
-
基金
基础加强1912项目。
-
文摘
为提升多无人作战飞机空战的协同作战能力,提出一种基于多智能体双延迟深度确定性策略梯度(MATD3)的协同空战机动决策方法。首先,基于无人作战飞机的三自由度动力学模型构建空战环境,并结合飞行员的操纵方式,设计以控制量的变化量表示的动作空间。其次,优化了状态空间和奖励函数的设计,将友机与敌机的相对关系引入状态空间,根据相对角度、相对距离等空战态势因素建立连续型奖励函数,将飞行约束条件融入离散型奖励函数,提升机动决策的准确性和机动飞行的安全性;采用分阶段训练、启发式引导、双探索机制、交替冻结博弈等训练方法,提高算法的收敛速度和机动策略的鲁棒性。最后,构建了二对一空战的仿真场景,结果表明我方双机能够展现出明显的配合行为,提高了对空战态势的感知能力。
-
关键词
无人作战飞机
协同空战
机动决策
多智能体
深度强化学习
matd3
-
Keywords
UCAV
cooperativeair combat
maneuver decision
multi-agent
deep reinforcement learning
matd3
-
分类号
TJ760
[兵器科学与技术—武器系统与运用工程]
-
-
题名基于PER-MATD3的多无人机攻防对抗机动决策
被引量:7
- 2
-
-
作者
符小卫
徐哲
朱金冬
王楠
-
机构
西北工业大学电子信息学院
西安应用光学研究所
航空工业沈阳飞机设计研究所体系部
-
出处
《航空学报》
EI
CAS
CSCD
北大核心
2023年第7期191-204,共14页
-
基金
航空科学基金(2020Z023053001)。
-
文摘
以障碍物随机分布的复杂环境下多无人机攻防对抗机动决策为研究背景,构建了攻防双方运动模型及雷达探测模型,将双延迟深度确定性策略梯度(TD3)算法扩展到多智能体领域中以解决多智能体深度确定性策略梯度(MADDPG)算法存在值函数高估的问题;在此基础上,为了提升算法学习效率,结合优先经验回放机制提出了优先经验回放多智能体双延迟深度确定性策略算法(PER-MATD3)。通过仿真实验表明本文所设计的方法在多无人机攻防对抗机动决策问题中具有较好的对抗效果,并通过对比验证了(PER-MATD3)算法相较其他算法在收敛速度和稳定性方面的优势。
-
关键词
多无人机
多智能体强化学习
PER-matd3
攻防对抗
机动决策
-
Keywords
multi-UAVs
multi-agent reinforcement learning
PER-matd3
attack-defence confrontation
maneuvering decision-making
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
-
-
题名M-DRL的低轨道卫星网络计算卸载和任务迁移
- 3
-
-
作者
徐飞
宁辛
安朔
申奥祥
王泽轩
-
机构
西安工业大学计算机科学与工程学院
-
出处
《西安工业大学学报》
CAS
2024年第3期395-404,共10页
-
基金
咸阳市科技局重点研发项目(2021ZDYF-NY-0019)。
-
文摘
针对无人机网络高时延、低性能、有限带宽、难以解决复杂计算任务问题,提出了一种将低地球轨道卫星和移动边缘计算技术结合形成的MEC辅助LEO卫星网络计算卸载和任务迁移方法。首先通过建立本地计算模型、卸载模型和迁移模型,确定目标优化成本函数。然后为降低模型复杂度,引入多智能体深度强化学习模型,利用多智能体双延迟深度确定性策略梯度(MATD3)算法求解优化问题,降低系统总时延。仿真结果表明,与本地计算及随机迁移算法相比,MATD3算法的任务处理时延分别降低94.55%和83.02%,证明了MATD3算法在计算卸载和任务迁移方面的有效性和可靠性。
-
关键词
LEO卫星网络
移动边缘计算
matd3算法
计算卸载
卫星通信
-
Keywords
LEO satellite network
mobile edge computing
matd3 algorithm
computing offloading
satellite communications
-
分类号
TN927.2
[电子电信—通信与信息系统]
-