基于强化学习的苏拉卡尔塔博弈算法

An reinforcement based game algorithm of Surakarta

下载PDF

导出

摘要本文探讨了基于蒙特卡洛方法的强化学习博弈程序的原理,基于该原理结合BP算法设计了一个进行自学习的苏拉卡尔塔博弈程序。实验证明,该方法能让智能体不断的学习提高棋力,避免了繁琐的手工构建静态评估函数过程。 The author discusses the principle of MCTS-based reinforcement learning.Based on this principle,BP algorithm is combined,we design a self-learning game playing program of Surakarta.The experiment shows that the methods can improve the performance of the agent,avoiding design static evaluating function by hand.

作者王仁泉丁濛李淑琴石露颖戚译中刘朔言 WANG Renquan;DING Meng;LI Shuqin;SHI Luying;QI Yizhong;LIU Shuoyan(School of Computer,Beijing Information Science&Technology University,Beijing 100101,China)

机构地区北京信息科技大学计算机学院

出处《智能计算机与应用》 2020年第4期6-8,12,共4页 Intelligent Computer and Applications

基金北京信息科技大学2019年促进高校内涵发展-大学生科研训练项目(5101923400)

关键词强化学习计算机博弈苏拉卡尔塔棋人工神经网络 Reinforcement Learning Computer Game Surakarta Artificial Neural Network

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1南北.不走寻常路的蛋[J].海峡儿童,2020(30):46-47.
2李芳媛.大学英语“全课”建设质量评估体系模型构建[J].国内高等教育教学研究动态,2020(19):10-10.
3桂义勇.一种国际跳棋的博弈系统研究[J].智能计算机与应用,2020(4):32-34. 被引量：2

智能计算机与应用

2020年第4期

浏览历史

内容加载中请稍等...

基于强化学习的苏拉卡尔塔博弈算法

相关作者

相关机构

相关主题

浏览历史