期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于MADDPG的多无人机协同任务决策 被引量:29
1
作者 李波 越凯强 +1 位作者 甘志刚 高佩忻 《宇航学报》 EI CAS CSCD 北大核心 2021年第6期757-765,共9页
针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,... 针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。 展开更多
关键词 无人机 任务决策 深度强化学习 策略梯度 多智能体
下载PDF
基于三支决策的飞机空战机动决策方法 被引量:2
2
作者 越凯强 李波 范盘龙 《计算机应用》 CSCD 北大核心 2022年第2期616-621,共6页
为了提高战斗机在信息不充足条件下的机动决策能力,提出一种基于三支决策的飞机空战机动决策方法。首先,使用三支决策意图识别模型对目标意图进行识别;其次,将目标的作战意图因素引入到威胁评估中后,结合目标的威胁程度,提出基于三支决... 为了提高战斗机在信息不充足条件下的机动决策能力,提出一种基于三支决策的飞机空战机动决策方法。首先,使用三支决策意图识别模型对目标意图进行识别;其次,将目标的作战意图因素引入到威胁评估中后,结合目标的威胁程度,提出基于三支决策的机动决策权重因子动态调整法;最后,使用模糊逻辑构建机动决策因子评价函数,并利用权值动态调整策略和机动决策评价函数求出每一阶段飞机最佳的机动方式,从而形成可行有效的飞行路线。仿真实验结果表明,所设计的基于三支决策的飞机空战机动决策方法具有可行性和有效性。 展开更多
关键词 空战 机动决策方法 三支决策 作战意图 威胁评估
下载PDF
基于DDPG的无人机路径规划 被引量:3
3
作者 李琳 李双霖 高佩忻 《兵器装备工程学报》 CSCD 北大核心 2022年第2期176-180,共5页
针对无人机路径规划中传统算法面对未知情况时适应程度低、在线求解效率低、计算量大等问题,基于深度强化学习DDPG算法,提出了一种无人机路径规划方法。采用策略网络和评价网络的双网络结构,拟合无人机路径规划决策函数和状态动作函数,... 针对无人机路径规划中传统算法面对未知情况时适应程度低、在线求解效率低、计算量大等问题,基于深度强化学习DDPG算法,提出了一种无人机路径规划方法。采用策略网络和评价网络的双网络结构,拟合无人机路径规划决策函数和状态动作函数,根据状态空间、动作空间和网络结构设计了DDPG算法模型。通过仿真验证了所提出的路径规划方法的有效性。 展开更多
关键词 无人机 路径规划 深度强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部