期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于元Q学习与DDPG的机械臂接近技能学习方法 被引量:1
1
作者 李茂捷 徐国政 +1 位作者 高翔 谭彩铭 《南京邮电大学学报(自然科学版)》 北大核心 2023年第1期96-103,共8页
针对深度强化学习方法在机械臂的接近技能学习中普遍存在的样本效率低、泛化性差的问题,提出一种基于元Q学习的技能学习方法。首先利用结合后视经验回放(Hindsight Experience Replay, HER)的DDPG训练机械臂以指定姿态到达目标点,验证... 针对深度强化学习方法在机械臂的接近技能学习中普遍存在的样本效率低、泛化性差的问题,提出一种基于元Q学习的技能学习方法。首先利用结合后视经验回放(Hindsight Experience Replay, HER)的DDPG训练机械臂以指定姿态到达目标点,验证了算法在接近任务中的有效性;其次,在相关任务集上构造多任务目标作为优化对象,利用结合HER的DDPG训练模型,得到泛化性强的元训练模型和元训练数据,此外利用GRU获取轨迹上下文变量;最后,先在新任务上进行少量训练,再利用元训练数据训练模型进一步提升性能。仿真实验表明,在初始性能、学习速率和收敛性能三方面元Q学习均带来明显提升,其中达到期望性能所需样本量降低77%,平均成功率提高15%。 展开更多
关键词 机器人学习 强化学习 深度确定性策略梯度 元q学习 样本效率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部