期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
最新无模型深度强化学习研究:从零开始训练机器人“玩乐高” 被引量:2
1
作者 Tuomas Haarnoja Vitchyr Pong +3 位作者 Aurick Zhou Murtaza Dalal pieter abbeel Sergey Levine 《机器人产业》 2018年第3期48-51,共4页
伯克利最新提出无模型深度强化学习方法——soft Q-learning(SQL)算法,该算法可以对模拟和现实世界的任务执行组合性,同时在该算法基础上提出了一种使用具有表达性的神经网络策略学习机器人操作技能的学习框架。
关键词 机器人系统 强化学习 无模型 型深 训练 学习方法 人类学习 基于模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部