期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的多无人机协同防撞策略研究
1
作者 霍琳 李诗琪 +2 位作者 费思邈 齐奂超 胡正宇 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第3期175-181,共7页
针对多无人机协同执行任务过程中可能与静态障碍物和其他无人机碰撞的问题,提出了一种基于深度强化学习的协同防撞策略。首先,将每个无人机看作一个独立的决策个体,并应用深度神经网络拟合其策略函数和价值函数。然后,在独立近端策略优... 针对多无人机协同执行任务过程中可能与静态障碍物和其他无人机碰撞的问题,提出了一种基于深度强化学习的协同防撞策略。首先,将每个无人机看作一个独立的决策个体,并应用深度神经网络拟合其策略函数和价值函数。然后,在独立近端策略优化算法的基础上,提出了一种只观测部分目标信息并排序的观测空间设计方法。解决了神经网络输入维度过大时难以训练的问题。最后,以25架无人机协同执行任务过程中的防撞问题为例进行了算法设计和网络结构设计,并通过仿真实验验证了所提出防撞策略的有效性。 展开更多
关键词 多无人机 协同防撞 深度强化学习 独立近端策略优化 观测设计
下载PDF
基于策略增益均衡的异构无人机协同决策方法 被引量:3
2
作者 费思邈 霍琳 李诗琪 《兵器装备工程学报》 CSCD 北大核心 2021年第11期174-180,共7页
采用多智能体强化学习方法训练多个异构无人机智能协同执行复杂任务时,通常因为每个无人机的策略改变而影响其他无人机的训练进程,导致训练结果的震荡甚至无法收敛。针对这一问题,以多个攻击型无人机和干扰型无人机组成混合编队,通过封... 采用多智能体强化学习方法训练多个异构无人机智能协同执行复杂任务时,通常因为每个无人机的策略改变而影响其他无人机的训练进程,导致训练结果的震荡甚至无法收敛。针对这一问题,以多个攻击型无人机和干扰型无人机组成混合编队,通过封锁区并攻击有价值目标的复杂协同任务为背景,提出了一种新的群体策略水平增益均衡方法,结合多智能体独立强化学习训练技术,通过最大化每个无人机自身的奖赏,而不是优化整个集群的最大化奖赏来训练2种异构智能体协同合作,实现异构智能体稳定的探索和策略优化。最后通过仿真实验证明了该方法的有效性和优越性。 展开更多
关键词 异构无人机 强化学习 协同决策 策略增益均衡 PPO
下载PDF
探测器安全着陆风险评估与敏感性分析 被引量:1
3
作者 李涛 杨军 费思邈 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2011年第11期1461-1464,共4页
探测器安全着陆是行星探测的关键环节,而目前着陆成功率偏低,进行安全着陆风险研究有着非常现实的工程需求.为此,首先分析探测器结构与着陆方式,梳理行星表面影响安全着陆的主要因素,明确着陆安全判据,然后基于蒙特卡罗思想,模拟行星表... 探测器安全着陆是行星探测的关键环节,而目前着陆成功率偏低,进行安全着陆风险研究有着非常现实的工程需求.为此,首先分析探测器结构与着陆方式,梳理行星表面影响安全着陆的主要因素,明确着陆安全判据,然后基于蒙特卡罗思想,模拟行星表面地貌和探测器着陆方式,给出了探测器在盲降下安全着陆概率估计的仿真方法.在此基础上,考虑探测器尺寸和着陆区域面积,对探测器安全着陆概率进行敏感性分析,结果表明探测器的尺寸对安全着陆概率有显著影响. 展开更多
关键词 探测器 着陆 风险评估 敏感性分析
下载PDF
基于遗传算法的飞行管理系统余度配置优化方法 被引量:2
4
作者 霍琳 费思邈 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2017年第7期1306-1312,共7页
余度设计是飞行管理系统研制过程中提升其安全性的主要手段之一。针对余度设计受制造预算(经济性)与使用阶段维修保障资源消耗(可靠性)的制约问题,基于飞行管理系统的安全性、基本可靠性及经济性数学模型,利用改进后适用于整数优化的遗... 余度设计是飞行管理系统研制过程中提升其安全性的主要手段之一。针对余度设计受制造预算(经济性)与使用阶段维修保障资源消耗(可靠性)的制约问题,基于飞行管理系统的安全性、基本可靠性及经济性数学模型,利用改进后适用于整数优化的遗传算法,提出了一种以安全性为目标、基本可靠性与经济性为约束的余度配置优化方法,并以实例说明其适用于较为复杂系统的余度配置优化。经过敏感性分析发现,安全性指标最优值随着基本可靠性约束下限的提高而降低,随着经济性约束上限的增加而增加。2种约束条件对优化目标竞争约束,在同一时刻只有1种约束条件起主要约束作用。 展开更多
关键词 余度优化 安全性优化 遗传算法 飞行管理系统 基本可靠性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部