-
题名基于深度强化学习的多代理马尔科夫游戏
被引量:1
- 1
-
-
作者
罗舒俊
-
机构
北师大二附中国际部
-
出处
《电脑编程技巧与维护》
2018年第12期10-13,共4页
-
文摘
深度强化学习在许多复杂的决策问题中都有很好的表现,然而在许多场景下,多代理互动问题带来了对强化学习的挑战。多代理场景作为深度强化学习中的另一个挑战,提出了一种基于最小最大的深度Q学习算法,在决策过程相比于传统方法中,该算法可以应对对手的变化并且做出更好的回应。通过研究对机器人足球的游戏实验的深入分析,进一步展示了该算法的能力,并且展示了该算法可以很好地应用于其他多代理场景。
-
关键词
深度强化学习
多代理互动
马尔科夫游戏
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名Torus
- 2
-
-
作者
陈一帆
-
机构
北师大二附中国际部
-
出处
《留学》
2018年第21期90-91,共2页
-
文摘
应用拓扑学对我来说是一个极大的挑战,过去所学的大多都是高等代数知识,像拓扑学这种将代数和图像结合起来的学科是我第一次接触.在学习拓扑学的同时我也在教授的指导下学习了线性代数,这次经历让我了解了什么叫真正的数学,也让我更加确定了未来学习应用数学的决心.本论文的主题为torus,这是一个拓扑学中重要的结构之一,此次自主研究也让我了解了拓扑结构在现实生活中的应用,第一次真正的将理论数学和应用数学结合起来.
-
关键词
学术论文
作品展示
应用数学
记者
高等代数
拓扑结构
拓扑学
线性代数
-
分类号
O29
[理学—应用数学]
-
-
题名在江南邂逅美丽
- 3
-
-
作者
姚沚君
-
机构
北师大二附中国际部高一一班
-
出处
《东方少年(快乐文学)》
2016年第8期54-54,共1页
-
文摘
在这江南之中邂逅一段美丽。青石板,铺满了紫丁香的芬芳,静谧中,是谁的脚步扰了花开的安宁?我撑着一把油纸伞,任一场绵绵的烟雨恣意打在古铜色的伞上。老墙,旧院,长满青苔的悠悠深巷。一个老妇人坐在自家门前,细细地择菜。她坐在屋檐下,面前摆着两个盆,一个装满水,一个是空的。
-
关键词
江南
紫丁香
古铜色
青苔
-
分类号
S685.26
[农业科学—观赏园艺]
-