期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于MADDPG的多阵面相控阵雷达引导搜索资源优化算法
1
作者
王腾
黄俊松
+2 位作者
王乐庭
张才坤
李枭扬
《计算机工程》
CAS
CSCD
北大核心
2024年第11期38-48,共11页
针对传统单阵面雷达搜索资源优化算法在复杂多阵面场景下的参数求解困难问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多阵面雷达搜索资源优化算法。考虑多阵面相控阵雷达场景约束,结合机载雷达实际搜索任务需求,建立基于最...
针对传统单阵面雷达搜索资源优化算法在复杂多阵面场景下的参数求解困难问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多阵面雷达搜索资源优化算法。考虑多阵面相控阵雷达场景约束,结合机载雷达实际搜索任务需求,建立基于最大目标平均积累期望发现概率的多阵面雷达搜索资源优化模型。分别设计多智能体局部及全局观测空间和带折扣因子的复合奖励函数,基于执行者-评论者(Actor-Critic)算法结构,通过各智能体策略网络在线更新各雷达阵面搜索资源分配系数实现上述模型参数的优化求解。仿真结果表明,该算法能够根据空域-目标覆盖情况及各目标威胁权系数迅速作出精确的自主决策,在多阵面相控阵雷达搜索资源优化场景下的表现显著优于传统算法。
展开更多
关键词
多阵面相控阵雷达
雷达搜索资源优化
多智能体深度强化学习
深度确定性策略梯度
集群目标雷达引导搜索
下载PDF
职称材料
行星软着陆GPS有模型强化学习制导方法
被引量:
2
2
作者
张阳康
孙晨
泮斌峰
《飞控与探测》
2021年第5期34-43,共10页
由于距离地球较远、测控延时误差较大、飞行环境十分复杂且难以提前预测,行星软着陆的自主制导技术目前面临着水平位置估计困难、导航参考信息匮乏、复杂地形着陆困难等挑战。针对行星软着陆存在的困难和挑战,提出了基于引导策略搜索算...
由于距离地球较远、测控延时误差较大、飞行环境十分复杂且难以提前预测,行星软着陆的自主制导技术目前面临着水平位置估计困难、导航参考信息匮乏、复杂地形着陆困难等挑战。针对行星软着陆存在的困难和挑战,提出了基于引导策略搜索算法的有模型强化学习制导方法,实现了着陆器在初始状态受到扰动时无需重新规划,仍能在满足约束条件的情况下降落在指定位置。该方法首先将迭代线性二次调节器作为控制器,产生初始轨迹;其次,利用多层神经网络拟合制导策略;最后,利用控制器监督策略学习,进而收敛,产生可行策略。针对行星表面软着陆的仿真验证结果显示,该算法仅通过几次循环,即可实现初始状态变化的快速软着陆。该方法一方面表明了基于有模型强化学习的数据的高效利用率,另一方面也证明了强化学习方法在深空探测领域中具有广阔的应用前景。
展开更多
关键词
迭代线性二次调节器
引导策略搜索
有模型强化学习
行星软着陆
下载PDF
职称材料
题名
基于MADDPG的多阵面相控阵雷达引导搜索资源优化算法
1
作者
王腾
黄俊松
王乐庭
张才坤
李枭扬
机构
西北工业大学电子信息学院
上海机电工程研究所
上海航天电子通讯设备研究所
中国人民解放军
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第11期38-48,共11页
基金
智能博弈重点实验室创新工作站开放课题(ZBKF-23-04)。
文摘
针对传统单阵面雷达搜索资源优化算法在复杂多阵面场景下的参数求解困难问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多阵面雷达搜索资源优化算法。考虑多阵面相控阵雷达场景约束,结合机载雷达实际搜索任务需求,建立基于最大目标平均积累期望发现概率的多阵面雷达搜索资源优化模型。分别设计多智能体局部及全局观测空间和带折扣因子的复合奖励函数,基于执行者-评论者(Actor-Critic)算法结构,通过各智能体策略网络在线更新各雷达阵面搜索资源分配系数实现上述模型参数的优化求解。仿真结果表明,该算法能够根据空域-目标覆盖情况及各目标威胁权系数迅速作出精确的自主决策,在多阵面相控阵雷达搜索资源优化场景下的表现显著优于传统算法。
关键词
多阵面相控阵雷达
雷达搜索资源优化
多智能体深度强化学习
深度确定性策略梯度
集群目标雷达引导搜索
Keywords
multi-antenna phased array radar
radar
search
resource optimization
multi-agent deep reinforcement learning
Deep Deterministic
policy
Gradient(DDPG)
radar-
guided
search
for cluster target
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
行星软着陆GPS有模型强化学习制导方法
被引量:
2
2
作者
张阳康
孙晨
泮斌峰
机构
西北工业大学航天学院
航天飞行动力学技术国家级重点实验室
出处
《飞控与探测》
2021年第5期34-43,共10页
基金
装备预研实验室基金(6142210200312)。
文摘
由于距离地球较远、测控延时误差较大、飞行环境十分复杂且难以提前预测,行星软着陆的自主制导技术目前面临着水平位置估计困难、导航参考信息匮乏、复杂地形着陆困难等挑战。针对行星软着陆存在的困难和挑战,提出了基于引导策略搜索算法的有模型强化学习制导方法,实现了着陆器在初始状态受到扰动时无需重新规划,仍能在满足约束条件的情况下降落在指定位置。该方法首先将迭代线性二次调节器作为控制器,产生初始轨迹;其次,利用多层神经网络拟合制导策略;最后,利用控制器监督策略学习,进而收敛,产生可行策略。针对行星表面软着陆的仿真验证结果显示,该算法仅通过几次循环,即可实现初始状态变化的快速软着陆。该方法一方面表明了基于有模型强化学习的数据的高效利用率,另一方面也证明了强化学习方法在深空探测领域中具有广阔的应用前景。
关键词
迭代线性二次调节器
引导策略搜索
有模型强化学习
行星软着陆
Keywords
iterative Linear Quadratic Regulator(iLQR)
guided
policy
search
(
gps
)
model-based reinforcement learning
planetary soft landing
分类号
TN911.73 [电子电信—通信与信息系统]
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于MADDPG的多阵面相控阵雷达引导搜索资源优化算法
王腾
黄俊松
王乐庭
张才坤
李枭扬
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
行星软着陆GPS有模型强化学习制导方法
张阳康
孙晨
泮斌峰
《飞控与探测》
2021
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部