期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
引入混合超网络改进MADDPG的双机编队空战自主机动决策
1
作者
李文韬
方峰
+2 位作者
王振亚
朱奕超
彭冬亮
《航空学报》
EI
CAS
CSCD
北大核心
2024年第17期214-228,共15页
针对局部信息可观测的双机编队空战协同奖励难以量化设计、智能体协同效率低、机动决策效果欠佳的问题,提出了一种引入混合超网络改进多智能体深度确定性策略梯度(MADDPG)的空战机动决策方法。采用集中式训练-分布式执行架构,满足单机...
针对局部信息可观测的双机编队空战协同奖励难以量化设计、智能体协同效率低、机动决策效果欠佳的问题,提出了一种引入混合超网络改进多智能体深度确定性策略梯度(MADDPG)的空战机动决策方法。采用集中式训练-分布式执行架构,满足单机智能体在局部观测数据下对于全局最优机动决策的训练需求。在为各单机设计兼顾局部快速引导和全局打击优势的奖励函数基础上,引入混合超网络将各单机估计的Q值进行单调非线性混合得到双机协同的全局策略Q值,指导分布式Actor网络更新参数,解决多智能体深度强化学习中信度分配难的问题。大量仿真结果表明,相较于典型的MADDPG方法,该方法能够更好地引导各单机做出符合全局协同最优的机动决策指令,且拥有更高的对抗胜率。
展开更多
关键词
无人作战飞机
空战机动决策
多智能体深度确定性策略梯度(MADDPG)
混合超网络
集中式
训练
-
分布式
执行
原文传递
针对集群攻击的飞行器智能协同拦截策略
被引量:
1
2
作者
高树一
林德福
+1 位作者
郑多
胡馨予
《航空学报》
EI
CAS
CSCD
北大核心
2023年第18期271-286,共16页
无人集群间拦截博弈对抗是未来智能化战争的重要作战场景。针对飞行器集群攻击的协同拦截博弈对抗问题,提出了一种基于近端策略优化方法的多智能体深度强化学习协同拦截策略,将单智能体近端策略优化算法和集中式评价分布式执行算法架构...
无人集群间拦截博弈对抗是未来智能化战争的重要作战场景。针对飞行器集群攻击的协同拦截博弈对抗问题,提出了一种基于近端策略优化方法的多智能体深度强化学习协同拦截策略,将单智能体近端策略优化算法和集中式评价分布式执行算法架构相结合,设计了一种多智能体强化学习智能机动策略,在此基础上为解决算法收敛慢的问题,引入广义优势函数提升算法的收敛性能。仿真结果表明,多机智能协同拦截策略赋予飞行器自主学习的属性,能够根据实时战场态势智能自主分配拦截任务,且通过约束策略更新幅度提升了算法收敛速率。经过不断迭代自学习,能够实现拦截策略的自主优化,在不同的场景下自学习提升协同拦截效能。
展开更多
关键词
群目标协同拦截
近端策略优化
多智能体强化学习
集中式评价-分布式执行
深度学习
原文传递
题名
引入混合超网络改进MADDPG的双机编队空战自主机动决策
1
作者
李文韬
方峰
王振亚
朱奕超
彭冬亮
机构
杭州电子科技大学自动化学院
中国航天科技创新研究院
出处
《航空学报》
EI
CAS
CSCD
北大核心
2024年第17期214-228,共15页
基金
浙江省属高校基本科研业务费专项资金(GK209907299001-021)。
文摘
针对局部信息可观测的双机编队空战协同奖励难以量化设计、智能体协同效率低、机动决策效果欠佳的问题,提出了一种引入混合超网络改进多智能体深度确定性策略梯度(MADDPG)的空战机动决策方法。采用集中式训练-分布式执行架构,满足单机智能体在局部观测数据下对于全局最优机动决策的训练需求。在为各单机设计兼顾局部快速引导和全局打击优势的奖励函数基础上,引入混合超网络将各单机估计的Q值进行单调非线性混合得到双机协同的全局策略Q值,指导分布式Actor网络更新参数,解决多智能体深度强化学习中信度分配难的问题。大量仿真结果表明,相较于典型的MADDPG方法,该方法能够更好地引导各单机做出符合全局协同最优的机动决策指令,且拥有更高的对抗胜率。
关键词
无人作战飞机
空战机动决策
多智能体深度确定性策略梯度(MADDPG)
混合超网络
集中式
训练
-
分布式
执行
Keywords
unmanned combat aerial vehicle
air combat maneuvering decision
Multi
-
Agent Deep Deterministic Policy Gradient(MADDPG)
hybrid hyper network
centralized training with decentralized execution
分类号
V249.12 [航空宇航科学与技术—飞行器设计]
原文传递
题名
针对集群攻击的飞行器智能协同拦截策略
被引量:
1
2
作者
高树一
林德福
郑多
胡馨予
机构
北京理工大学宇航学院
北京理工大学徐特立学院
出处
《航空学报》
EI
CAS
CSCD
北大核心
2023年第18期271-286,共16页
基金
国家自然科学基金青年基金项目(61903350)
教育部产学研创新项目(2021ZYA02002)
北京理工大学青年教师学术启动计划(3010011182130)。
文摘
无人集群间拦截博弈对抗是未来智能化战争的重要作战场景。针对飞行器集群攻击的协同拦截博弈对抗问题,提出了一种基于近端策略优化方法的多智能体深度强化学习协同拦截策略,将单智能体近端策略优化算法和集中式评价分布式执行算法架构相结合,设计了一种多智能体强化学习智能机动策略,在此基础上为解决算法收敛慢的问题,引入广义优势函数提升算法的收敛性能。仿真结果表明,多机智能协同拦截策略赋予飞行器自主学习的属性,能够根据实时战场态势智能自主分配拦截任务,且通过约束策略更新幅度提升了算法收敛速率。经过不断迭代自学习,能够实现拦截策略的自主优化,在不同的场景下自学习提升协同拦截效能。
关键词
群目标协同拦截
近端策略优化
多智能体强化学习
集中式评价-分布式执行
深度学习
Keywords
multi
-
target cooperative interception
proximal policy optimization
multi
-
agent reinforcement learning
centralized evaluation
-
distributed execution
deep learning
分类号
V279 [航空宇航科学与技术—飞行器设计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
引入混合超网络改进MADDPG的双机编队空战自主机动决策
李文韬
方峰
王振亚
朱奕超
彭冬亮
《航空学报》
EI
CAS
CSCD
北大核心
2024
0
原文传递
2
针对集群攻击的飞行器智能协同拦截策略
高树一
林德福
郑多
胡馨予
《航空学报》
EI
CAS
CSCD
北大核心
2023
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部