期刊文献+

MuZero算法在多种棋类游戏中的表现“超越人类”

下载PDF
导出
摘要 一直以来,人工智能领域的科学家们都想构建出具备规划能力的智能体。最近,DeepMind的研究人员提出了一种称之为MuZero的算法。该算法结合了基于高性能规划和无模型强化学习算法两种方法的优点,在不具备任何底层动态知识和游戏规则的情况下,通过结合基于树的搜索和学得模型,在国际象棋、日本将棋、围棋等棋类游戏中的性能表现可媲美AlphaZero,超越人类。
机构地区 不详
出处 《机器人产业》 2019年第6期21-25,共5页 Robot Industry
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部