摘要
1前言在上一期里,我们说明了当人类的慢想(创意)与AI的快思(直觉)互相平衡时,最能展现协同创造力。有了AI经验直觉来协助去芜存菁,人类更敢超越经验去进行大跨度的联想和探索。这样的协同组织体系,非常适合与高度不确定的外在环境(Environment)互动,并从外在环境获取最大的回报。这是自然界生物(有机体系)的天赋学习本质,非常接近于AI强化学习(Reinforcement Learning,简称RL)机制。例如,AlphaGo Zero增添了RL,就具有更强大的探索能力,能够在不确定性极大的围棋上打败人类的顶尖高手,如图1。
出处
《电子产品世界》
2022年第8期11-13,共3页
Electronic Engineering & Product World