期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进指针网络的卫星对地观测任务规划方法 被引量:2
1
作者 马一凡 赵凡宇 +1 位作者 王鑫 金仲和 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2021年第2期395-401,共7页
针对卫星观测任务规划问题约束复杂、求解空间大和输入任务序列长度不固定的特点,使用深度强化学习(DRL)方法对卫星观测任务规划问题进行求解.综合考虑时间窗口约束、任务间转移机动时间和卫星电量、存储约束,对卫星观测任务规划问题进... 针对卫星观测任务规划问题约束复杂、求解空间大和输入任务序列长度不固定的特点,使用深度强化学习(DRL)方法对卫星观测任务规划问题进行求解.综合考虑时间窗口约束、任务间转移机动时间和卫星电量、存储约束,对卫星观测任务规划问题进行建模.基于指针网络(PN)的运行机制建立序列决策算法模型,使用Mask向量来考虑卫星观测任务规划问题中的各类约束,并通过Actor Critic强化学习算法对模型进行训练,以获得最大的收益率.借鉴多头注意力(MHA)机制的思想对PN进行改进,提出多头注意力指针网络(MHA-PN)算法.根据实验结果可以看出,MHA-PN算法显著提高了模型的训练速度和泛化性能,训练好的MHA-PN算法模型可以直接对输入序列进行端到端的推理,避免传统启发式算法迭代求解的过程,具有较高的求解效率. 展开更多
关键词 卫星观测任务规划 组合优化问题 深度强化学习 指针网络(pn) Actor Critic 多头注意力指针网络(MHA-pn)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部