-
题名基于MADDPG的多无人机协同任务决策
被引量:29
- 1
-
-
作者
李波
越凯强
甘志刚
高佩忻
-
机构
西北工业大学电子信息学院
-
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2021年第6期757-765,共9页
-
基金
国家自然科学基金(61573285,62003267)
陕西省自然科学基金(2020JQ-220)
+1 种基金
航空科学基金(2017ZC53021)
数据链技术重点实验室开放基金(CLDL-20182101)。
-
文摘
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。
-
关键词
无人机
任务决策
深度强化学习
策略梯度
多智能体
-
Keywords
UAV
Task decision-making
Deep reinforcement learning
Policy gradient
Multi-agent
-
分类号
TJ0114
[兵器科学与技术—兵器发射理论与技术]
-
-
题名基于三支决策的飞机空战机动决策方法
被引量:2
- 2
-
-
作者
越凯强
李波
范盘龙
-
机构
西北工业大学电子信息学院
中国航空工业集团有限公司西安航空计算技术研究所
-
出处
《计算机应用》
CSCD
北大核心
2022年第2期616-621,共6页
-
基金
航空科学基金资助项目(2017ZC53021)
数据链技术重点实验室开放基金资助项目(CLDL⁃20182101)。
-
文摘
为了提高战斗机在信息不充足条件下的机动决策能力,提出一种基于三支决策的飞机空战机动决策方法。首先,使用三支决策意图识别模型对目标意图进行识别;其次,将目标的作战意图因素引入到威胁评估中后,结合目标的威胁程度,提出基于三支决策的机动决策权重因子动态调整法;最后,使用模糊逻辑构建机动决策因子评价函数,并利用权值动态调整策略和机动决策评价函数求出每一阶段飞机最佳的机动方式,从而形成可行有效的飞行路线。仿真实验结果表明,所设计的基于三支决策的飞机空战机动决策方法具有可行性和有效性。
-
关键词
空战
机动决策方法
三支决策
作战意图
威胁评估
-
Keywords
air combat
maneuver decision method
three-way decision
combat intention
threat assessment
-
分类号
TJ0114
[兵器科学与技术—兵器发射理论与技术]
-
-
题名基于DDPG的无人机路径规划
被引量:3
- 3
-
-
作者
李琳
李双霖
高佩忻
-
机构
中国电子科技集团公司第二十研究所
西北工业大学电子信息学院
-
出处
《兵器装备工程学报》
CSCD
北大核心
2022年第2期176-180,共5页
-
基金
国防科技基础加强计划资助。
-
文摘
针对无人机路径规划中传统算法面对未知情况时适应程度低、在线求解效率低、计算量大等问题,基于深度强化学习DDPG算法,提出了一种无人机路径规划方法。采用策略网络和评价网络的双网络结构,拟合无人机路径规划决策函数和状态动作函数,根据状态空间、动作空间和网络结构设计了DDPG算法模型。通过仿真验证了所提出的路径规划方法的有效性。
-
关键词
无人机
路径规划
深度强化学习
-
Keywords
UAV
path planning
deep reinforcement learning
-
分类号
TJ0114
[兵器科学与技术—兵器发射理论与技术]
-