期刊文献+

学贯中西(10):从RL领会如何与不确定性共舞

Reinforcement learning for dealing with decision making under uncertainty
下载PDF
导出
摘要 1前言在上一期里,我们说明了当人类的慢想(创意)与AI的快思(直觉)互相平衡时,最能展现协同创造力。有了AI经验直觉来协助去芜存菁,人类更敢超越经验去进行大跨度的联想和探索。这样的协同组织体系,非常适合与高度不确定的外在环境(Environment)互动,并从外在环境获取最大的回报。这是自然界生物(有机体系)的天赋学习本质,非常接近于AI强化学习(Reinforcement Learning,简称RL)机制。例如,AlphaGo Zero增添了RL,就具有更强大的探索能力,能够在不确定性极大的围棋上打败人类的顶尖高手,如图1。
作者 高焕堂
机构地区 铭传大学 长庚大学
出处 《电子产品世界》 2022年第8期11-13,共3页 Electronic Engineering & Product World
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部