期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进指针网络的卫星对地观测任务规划方法
被引量:
2
1
作者
马一凡
赵凡宇
+1 位作者
王鑫
金仲和
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2021年第2期395-401,共7页
针对卫星观测任务规划问题约束复杂、求解空间大和输入任务序列长度不固定的特点,使用深度强化学习(DRL)方法对卫星观测任务规划问题进行求解.综合考虑时间窗口约束、任务间转移机动时间和卫星电量、存储约束,对卫星观测任务规划问题进...
针对卫星观测任务规划问题约束复杂、求解空间大和输入任务序列长度不固定的特点,使用深度强化学习(DRL)方法对卫星观测任务规划问题进行求解.综合考虑时间窗口约束、任务间转移机动时间和卫星电量、存储约束,对卫星观测任务规划问题进行建模.基于指针网络(PN)的运行机制建立序列决策算法模型,使用Mask向量来考虑卫星观测任务规划问题中的各类约束,并通过Actor Critic强化学习算法对模型进行训练,以获得最大的收益率.借鉴多头注意力(MHA)机制的思想对PN进行改进,提出多头注意力指针网络(MHA-PN)算法.根据实验结果可以看出,MHA-PN算法显著提高了模型的训练速度和泛化性能,训练好的MHA-PN算法模型可以直接对输入序列进行端到端的推理,避免传统启发式算法迭代求解的过程,具有较高的求解效率.
展开更多
关键词
卫星观测任务规划
组合优化问题
深度强化学习
指针
网络
(
pn
)
Actor
Critic
多头注意力
指针
网络
(MHA-
pn
)
下载PDF
职称材料
题名
基于改进指针网络的卫星对地观测任务规划方法
被引量:
2
1
作者
马一凡
赵凡宇
王鑫
金仲和
机构
浙江大学微小卫星研究中心
浙江省微纳卫星研究重点实验室
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2021年第2期395-401,共7页
基金
国家杰出青年科学基金资助项目(61525403)。
文摘
针对卫星观测任务规划问题约束复杂、求解空间大和输入任务序列长度不固定的特点,使用深度强化学习(DRL)方法对卫星观测任务规划问题进行求解.综合考虑时间窗口约束、任务间转移机动时间和卫星电量、存储约束,对卫星观测任务规划问题进行建模.基于指针网络(PN)的运行机制建立序列决策算法模型,使用Mask向量来考虑卫星观测任务规划问题中的各类约束,并通过Actor Critic强化学习算法对模型进行训练,以获得最大的收益率.借鉴多头注意力(MHA)机制的思想对PN进行改进,提出多头注意力指针网络(MHA-PN)算法.根据实验结果可以看出,MHA-PN算法显著提高了模型的训练速度和泛化性能,训练好的MHA-PN算法模型可以直接对输入序列进行端到端的推理,避免传统启发式算法迭代求解的过程,具有较高的求解效率.
关键词
卫星观测任务规划
组合优化问题
深度强化学习
指针
网络
(
pn
)
Actor
Critic
多头注意力
指针
网络
(MHA-
pn
)
Keywords
satellite observation task planning
combinatorial optimization problem
deep reinforcement learning
pointer networks(
pn
)
Actor Critic
multi-head attention pointer networks(MHA-
pn
)
分类号
V474 [航空宇航科学与技术—飞行器设计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进指针网络的卫星对地观测任务规划方法
马一凡
赵凡宇
王鑫
金仲和
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2021
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部