学贯中西(10):从RL领会如何与不确定性共舞

Reinforcement learning for dealing with decision making under uncertainty

下载PDF

导出

摘要 1前言在上一期里,我们说明了当人类的慢想(创意)与AI的快思(直觉)互相平衡时,最能展现协同创造力。有了AI经验直觉来协助去芜存菁,人类更敢超越经验去进行大跨度的联想和探索。这样的协同组织体系,非常适合与高度不确定的外在环境(Environment)互动,并从外在环境获取最大的回报。这是自然界生物(有机体系)的天赋学习本质,非常接近于AI强化学习(Reinforcement Learning,简称RL)机制。例如,AlphaGo Zero增添了RL,就具有更强大的探索能力,能够在不确定性极大的围棋上打败人类的顶尖高手,如图1。

作者高焕堂

机构地区铭传大学长庚大学

出处《电子产品世界》 2022年第8期11-13,共3页 Electronic Engineering & Product World

关键词自然界生物顶尖高手有机体系强化学习探索能力协同组织学习本质去芜存菁

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1冯凯.浅析运用现代教育理念改进初中体育教学方法[J].世纪之星—初中版,2021(12):117-118.
2薛汀.高中美术项目化学习实践探索——以微场景雕塑创作为例[J].辽宁教育,2022(9):62-65.
3余娟.东北师范大学教授姜强:自适应学习本质是个性化[J].在线学习,2022(5):62-65.
4高焕堂.学贯中西(9):人机协同如何激发创新力[J].电子产品世界,2022,29(7):14-16.
5郝鸿波.煤矿生产运营企业材料成本管理的现状与对策[J].经济技术协作信息,2022(21):0093-0095.
6魏光明.超越经验[J].教育研究与评论（小学教育教学）,2022(2):1-1.
7任虎虎.基于超越学习的高中物理教学策略[J].中学物理教学参考,2022(10):5-7.
8《教育研究与评论》(中学教育教学)重点话题征稿[J].教育研究与评论（中学教育教学）,2021(11):38-38.
9康建军.新形势下档案管理工作的难点及解决办法[J].文化产业,2022(17):117-119. 被引量：1
10陈俊雯.运用项目式学习,构建高效小学美术课堂[J].试题与研究,2022(19):190-191. 被引量：4

电子产品世界

2022年第8期

浏览历史

内容加载中请稍等...

学贯中西(10):从RL领会如何与不确定性共舞

相关作者

相关机构

相关主题

浏览历史