期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于目标的域随机化方法在机器人操作方面的研究 被引量:3
1
作者 张夏禹 陈小平 《计算机应用研究》 CSCD 北大核心 2022年第10期3084-3088,共5页
使用强化学习解决机器人操作问题有着诸多优势,然而传统的强化学习算法面临着奖励稀疏的困难,且得到的策略难以直接应用到现实环境中。为了提高策略从仿真到现实迁移的成功率,提出了基于目标的域随机化方法。使用基于目标的强化学习算... 使用强化学习解决机器人操作问题有着诸多优势,然而传统的强化学习算法面临着奖励稀疏的困难,且得到的策略难以直接应用到现实环境中。为了提高策略从仿真到现实迁移的成功率,提出了基于目标的域随机化方法。使用基于目标的强化学习算法对模型进行训练,可以有效地应对机器人操作任务奖励稀疏的情况,得到的策略可以在仿真环境下良好运行。与此同时在算法中还使用了目标驱动的域随机化方法,在提高策略泛用性以及克服仿真和现实环境之间的差距上有着良好的效果,仿真环境下的策略容易迁移到现实环境中并成功执行。结果表明,使用了基于目标的域随机化方法的强化学习算法有助于提高策略从仿真到现实迁移的成功率。 展开更多
关键词 强化学习 域随机化 机器人操作 仿真到现实迁移
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部