期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的无人艇轨迹跟踪算法研究 被引量:6
1
作者 夏家伟 朱旭芳 +1 位作者 罗亚松 吴兆东 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期74-80,共7页
针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增... 针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增强控制器的鲁棒性,生成轨迹任务数据集来模拟复杂的任务环境,以此作为深度强化学习控制器的训练样本输入.仿真结果表明:所提出的算法能有效收敛,具备扰动环境下的精确跟踪控制能力,有较大的实际应用潜力. 展开更多
关键词 水面无人艇(USV) 轨迹跟踪 深度强化学习(DRL) 近端策略优化(PPO) 轨迹任务数据集
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部