期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
半直接配点法在航天器追逃问题求解中的应用 被引量:10
1
作者 郝志伟 孙松涛 +1 位作者 张秋华 谌颖 《宇航学报》 EI CAS CSCD 北大核心 2019年第6期628-635,共8页
采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程... 采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程。在此数值方法中,根据半直接转换将微分对策问题转化为一个最优控制问题,由Gauss-Lobbato配点法最终将此最优问题转化为非线性规划问题,继而通过序列二次规划方法求解。这种半直接配点法避免微分对策问题最优策略的必要条件(两点边值问题)求解,并且数值稳定性好。数值仿真给出了追逃双发的最优控制策略和相应的追逃轨迹。 展开更多
关键词 航天器追逃问题 微分对策 最优控制 两点边值问题 半直接配点法
下载PDF
基于CW方程的航天器追逃问题半直接求解方法 被引量:1
2
作者 孙松涛 祝强军 宋斌 《上海航天》 CSCD 2019年第3期68-74,共7页
针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,... 针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。 展开更多
关键词 航天器追逃问题 微分对策 最优控制 两点边值问题 半直接配点法 非线性规划
下载PDF
基于分支深度强化学习的非合作目标追逃博弈策略求解 被引量:15
3
作者 刘冰雁 叶雄兵 +2 位作者 高勇 王新波 倪蕾 《航空学报》 EI CAS CSCD 北大核心 2020年第10期343-353,共11页
为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作... 为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作用下的追逃博弈问题;为避免传统深度强化学习应对连续空间存在维数灾难问题,通过构建模糊推理模型来表征连续空间,提出了一种具有多组并行神经网络和共享决策模块的分支深度强化学习架构。实现了最优控制与博弈论的结合,有效解决了微分对策模型高度非线性且难于利用经典最优控制理论进行求解的难题,进一步提升了深度强化学习对离散行为的学习能力,并通过算例仿真检验了该算法的有效性。 展开更多
关键词 非合作目标 空间交会 航天器追逃问题 连续空间 微分对策 深度强化学习 分支架构
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部