期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的无人艇轨迹跟踪算法研究
被引量:
6
1
作者
夏家伟
朱旭芳
+1 位作者
罗亚松
吴兆东
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第5期74-80,共7页
针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增...
针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增强控制器的鲁棒性,生成轨迹任务数据集来模拟复杂的任务环境,以此作为深度强化学习控制器的训练样本输入.仿真结果表明:所提出的算法能有效收敛,具备扰动环境下的精确跟踪控制能力,有较大的实际应用潜力.
展开更多
关键词
水面无人艇(USV)
轨迹
跟踪
深度强化学习(DRL)
近端策略优化(PPO)
轨迹任务数据集
原文传递
题名
基于深度强化学习的无人艇轨迹跟踪算法研究
被引量:
6
1
作者
夏家伟
朱旭芳
罗亚松
吴兆东
机构
海军工程大学兵器工程学院
海军工程大学电子工程学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023年第5期74-80,共7页
基金
湖北省自然科学基金资助项目(2018CFC865)
中国博士后基金资助项目(2016T45686)
全军军事类研究资助项目(YJ2020B117).
文摘
针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增强控制器的鲁棒性,生成轨迹任务数据集来模拟复杂的任务环境,以此作为深度强化学习控制器的训练样本输入.仿真结果表明:所提出的算法能有效收敛,具备扰动环境下的精确跟踪控制能力,有较大的实际应用潜力.
关键词
水面无人艇(USV)
轨迹
跟踪
深度强化学习(DRL)
近端策略优化(PPO)
轨迹任务数据集
Keywords
unmanned surface vehicle(USV)
trajectory tracking
deep reinforcement learning(DRL)
proximal policy optimization(PPO)
trajectory task data set
分类号
TP24 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的无人艇轨迹跟踪算法研究
夏家伟
朱旭芳
罗亚松
吴兆东
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2023
6
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部