期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DDPG的变外形航天飞行器碰撞规避的轨迹规划方法
1
作者
丁天雲
夏逸
+2 位作者
梅泽伟
邵星灵
刘俊
《兵工学报》
EI
CAS
CSCD
北大核心
2024年第11期3903-3914,共12页
针对变外形航天飞行器制导与变形决策强耦合问题,提出了基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)变外形碰撞规避的轨迹规划方法。依托变形参量建立变外形航天飞行器运动学模型,设计具有射程误差校正功能的纵...
针对变外形航天飞行器制导与变形决策强耦合问题,提出了基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)变外形碰撞规避的轨迹规划方法。依托变形参量建立变外形航天飞行器运动学模型,设计具有射程误差校正功能的纵向制导律和基于视线角偏差的横向制导律,实现绕飞障碍物并保证制导精度。建立适用于连续变外形的马尔可夫决策模型,以攻角、马赫数以及飞行器与障碍物的相对距离为状态空间,设计考虑碰撞的势场惩罚函数及满足制导精度的奖励函数,并构建DDPG网络实现状态空间到动作的尺度变换,得到最优外形决策指令。仿真结果表明:与固定外形航天飞行器相比,通过对外形最优决策,提高了航天飞行器制导精度和横向避障能力,降低了对机载雷达感知能力的要求,节省了感知成本。
展开更多
关键词
变外形航天飞行器
深度确定性策略梯度
智能决策
轨迹规划
碰撞规避
下载PDF
职称材料
基于强化学习的无人机安全避障与围捕制导
2
作者
梅泽伟
邵星灵
刘俊
《战术导弹技术》
北大核心
2024年第2期93-105,共13页
针对无人机在受约束环境下面临绕飞障碍物与跟踪目标相互掣肘的问题,提出了一种基于强化学习的无人机安全避障与围捕制导方法。根据极坐标原理设计环绕跟踪控制器,驱使无人机在GPS拒止的情况下到达预设的圆形轨道。将环绕约束和障碍物...
针对无人机在受约束环境下面临绕飞障碍物与跟踪目标相互掣肘的问题,提出了一种基于强化学习的无人机安全避障与围捕制导方法。根据极坐标原理设计环绕跟踪控制器,驱使无人机在GPS拒止的情况下到达预设的圆形轨道。将环绕约束和障碍物约束转化为马尔可夫过程,以速度、径向误差、角速度误差和碰撞函数为状态空间,以控制器的补偿量为动作空间,设计考虑跟踪误差和碰撞概率的奖励函数,利用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法对智能体进行训练,增强跟踪效果并获得避碰能力,实现无人机对静止/运动目标的环绕跟踪;此外,在训练过程中引入课程学习,将过去的学习策略转移到当前事件,与经典的随机参数设置相比,具有更快的收敛速度。最后仿真表明,所提算法可以引导无人机圆形环绕控制的同时高效规避障碍物。
展开更多
关键词
强化学习
避障
无人机
目标跟踪
环绕
GPS拒止
原文传递
题名
基于DDPG的变外形航天飞行器碰撞规避的轨迹规划方法
1
作者
丁天雲
夏逸
梅泽伟
邵星灵
刘俊
机构
中北大学仪器与电子学院
中北大学仪器科学与动态测试教育部重点实验室
中北大学电气与控制工程学院
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2024年第11期3903-3914,共12页
基金
国家自然科学基金项目(12345678、23456789)。
文摘
针对变外形航天飞行器制导与变形决策强耦合问题,提出了基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)变外形碰撞规避的轨迹规划方法。依托变形参量建立变外形航天飞行器运动学模型,设计具有射程误差校正功能的纵向制导律和基于视线角偏差的横向制导律,实现绕飞障碍物并保证制导精度。建立适用于连续变外形的马尔可夫决策模型,以攻角、马赫数以及飞行器与障碍物的相对距离为状态空间,设计考虑碰撞的势场惩罚函数及满足制导精度的奖励函数,并构建DDPG网络实现状态空间到动作的尺度变换,得到最优外形决策指令。仿真结果表明:与固定外形航天飞行器相比,通过对外形最优决策,提高了航天飞行器制导精度和横向避障能力,降低了对机载雷达感知能力的要求,节省了感知成本。
关键词
变外形航天飞行器
深度确定性策略梯度
智能决策
轨迹规划
碰撞规避
Keywords
morphing spacecraft
deep deterministic policy gradient
intelligent decision-making
trajectory planning
collision avoidance
分类号
V448.235 [航空宇航科学与技术—飞行器设计]
下载PDF
职称材料
题名
基于强化学习的无人机安全避障与围捕制导
2
作者
梅泽伟
邵星灵
刘俊
机构
中北大学
出处
《战术导弹技术》
北大核心
2024年第2期93-105,共13页
基金
国家自然科学基金项目(61803348)。
文摘
针对无人机在受约束环境下面临绕飞障碍物与跟踪目标相互掣肘的问题,提出了一种基于强化学习的无人机安全避障与围捕制导方法。根据极坐标原理设计环绕跟踪控制器,驱使无人机在GPS拒止的情况下到达预设的圆形轨道。将环绕约束和障碍物约束转化为马尔可夫过程,以速度、径向误差、角速度误差和碰撞函数为状态空间,以控制器的补偿量为动作空间,设计考虑跟踪误差和碰撞概率的奖励函数,利用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法对智能体进行训练,增强跟踪效果并获得避碰能力,实现无人机对静止/运动目标的环绕跟踪;此外,在训练过程中引入课程学习,将过去的学习策略转移到当前事件,与经典的随机参数设置相比,具有更快的收敛速度。最后仿真表明,所提算法可以引导无人机圆形环绕控制的同时高效规避障碍物。
关键词
强化学习
避障
无人机
目标跟踪
环绕
GPS拒止
Keywords
reinforcement learning
obstacle avoidance
unmanned aerial vehicles
target tracking
encircle
GPS-denied
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
V279 [航空宇航科学与技术—飞行器设计]
V249 [航空宇航科学与技术—飞行器设计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于DDPG的变外形航天飞行器碰撞规避的轨迹规划方法
丁天雲
夏逸
梅泽伟
邵星灵
刘俊
《兵工学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于强化学习的无人机安全避障与围捕制导
梅泽伟
邵星灵
刘俊
《战术导弹技术》
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部