一种自对弈棋局学习样例质量评价方法被引量：2

Method for Evaluating Quality of Self-play Chess Game Learning Examples

下载PDF

导出

摘要计算机棋类游戏学习中的自对弈学习指仅依赖行棋过程及最终的输赢结果的学习.整个过程中除下棋规则外不预设任何领域知识,也无专家指导.虽然基于极大极小算法、α-β剪枝算法和蒙特卡洛搜索的自对弈学习已经取得了卓越成果,但是目前仍旧缺乏对于学习样例质量评价的针对性研究.因此,本文首次提出了一种自对弈棋局学习样例质量评价方法,该方法采用样本规模综合指标T—使用样例重复度和样例个数的线性组合—来决定学习样例大小.在西洋跳棋上的实验表明,本评价方法可以达到有效控制学习样例规模的目的,在不降低学习效果的前提下大幅降低学习样例产生的计算成本. Self-play game learning in computer chess game learning refers to learning that relies only on the chess process and the final winning and losing results.Except for the rules of playing chess,no domain knowledge is preset in the whole process,and there is no expert guidance.Although the self-play learning based on the minimax algorithm,α-β pruning algorithm and Monte Carlo search has achieved excellent results,there is still a lack of targeted research on the quality evaluation of learning examples.Therefore,this paper proposes for the first time a self-play chess game learning sample quality evaluation method.This method uses a sample size comprehensive indicator T-using a linear combination of sample repeatability and sample number-to determine the size of the learning samples.Experiments on checkers show that the evaluation method can achieve the purpose of effectively controlling the size of the learning examples,and greatly reduce the calculation cost of the learning examples without reducing the learning effect.

作者姬波尤惠彬卢红星田欣柳宏川 JI Bo;YOU Hui-bin;LU Hong-xing;TIAN Xin;LIU Hong-chuan(School of Information Engineering,Zhengzhou University,Zhengzhou 450001.China;Fourth Generation of Industry Research Institute,Zhengzhou University,Zhengzhou 450001.China)

机构地区郑州大学信息工程学院郑州大学产业技术研究所第

出处《小型微型计算机系统》 CSCD 北大核心 2021年第3期467-471,共5页 Journal of Chinese Computer Systems

基金国家重点研发计划项目(2018YFB1201403)资助国家自然科学基金项目(61772475,61502434)资助。

关键词计算机博弈自对弈西洋跳棋样例质量 computer game self-play checkers sample quality

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1Xiyu Kang,Yiqi Wang,Yanrui Hu.Research on Different Heuristics for Minimax Algorithm Insight from Connect-4 Game[J].Journal of Intelligent Learning Systems and Applications,2019,11(2):15-31. 被引量：2
2郑昌松,贾丽娟,权贺,王彪.基于西洋跳棋的博弈程序研究[J].哈尔滨理工大学学报,2016,21(3):24-28. 被引量：6
3安萌萌,李淑琴.一种西洋跳棋评估算法[J].北京信息科技大学学报（自然科学版）,2017,32(2):85-88. 被引量：3

二级参考文献16

1王骄,王涛,罗艳红,徐心和.中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J].东北大学学报（自然科学版）,2005,26(10):949-952. 被引量：16
2李得胜.人工智能的又一次飞跃[J].世界科学,2007(10):31-32. 被引量：1
3NASTARAN Shafiei, FRANK van BreugeL Towards Model Chec- king of Computer Games with Java Path Finder[ J]. IEEE Press. 2013(13) :25 -29.
4NIELS Bottcher,HECTOR P. Martinez,Stefania Serafin. Procedur- al Audio in Computer Games Using Motion Controllers : An Evalua- tion on the Effect and Perception [ J ]. Hindawi Publishing Corp, 2013(11) :94 -97.
5SCOTI" A. WALLACE, INGRID Russell, ZDRAVKO Markov. Integrating Games and Machine Learning in the Undergraduate Computer Science Classroom [ J ]. ACM, 2008 ( 8 ) :231 - 236.
6张聪品,刘春红,徐久成.博弈树启发式搜索的α-β剪枝技术研究[J].计算机工程与应用,2008,44(16):54-55. 被引量：6
7周玮,王友政,马庆增.利用局势变化攫取优势博弈[J].系统仿真学报,2008,20(17):4505-4508. 被引量：1
8舒康元,胡福乔.中国象棋计算机博弈引擎改进[J].微计算机信息,2009(29):39-41. 被引量：1
9张明亮,李凡长.一种新的博弈树搜索方法[J].山东大学学报（工学版）,2009,39(6):1-7. 被引量：8
10徐长明,马宗民,徐心和,李新星.面向机器博弈的即时差分学习研究[J].计算机科学,2010,37(8):219-223. 被引量：4

共引文献6

1张家铭,王静文,李媛.基于改进UCT算法的国际跳棋博弈系统研究[J].智能计算机与应用,2022,12(1):128-131.
2桂义勇.一种国际跳棋的博弈系统研究[J].智能计算机与应用,2020(4):32-34. 被引量：2
3丁锦钰.基于神经网络和强化学习的西洋跳棋评估算法[J].电子制作,2019,27(4):45-46.
4田欣,姬波,卢红星,柳宏川,尤惠彬.基于赛制组织的遗传变异棋局样例生成算法[J].小型微型计算机系统,2021,42(5):927-934.
5王亚杰,祁冰枝,张云博,丁傲冬.结合神经网络的改进UCT在国际跳棋中的应用[J].重庆理工大学学报（自然科学）,2021,35(7):259-265. 被引量：5
6Norhan Hesham,Osama Abu-Elnasr,Samir Elmougy.A New Action-Based Reasoning Approach for Playing Chess[J].Computers, Materials & Continua,2021(10):175-190.

同被引文献13

1丁濛,张亦鹏,李淑琴.棋盘局面数据标定方法研究[J].计算机应用研究,2020,37(2):470-472. 被引量：3
2张利群,曹杨,李厦.点格棋计算机博弈平台通信接口[J].计算机与现代化,2016(3):96-99. 被引量：1
3焦嘉烽,李云.大数据下的典型机器学习平台综述[J].计算机应用,2017,37(11):3039-3047. 被引量：33
4陶永才,赵国桦,石磊,卫琳.一种改进的MapReduce互信息文本特征选择机制[J].小型微型计算机系统,2018,39(3):433-438. 被引量：7
5邱云飞,刘世兴,王璐.基于多指标融合的文本特征评价及选择算法[J].计算机工程与应用,2016,52(24):95-101. 被引量：3
6申培萍,陈晓.一类Minimax分式规划问题的迭代算法[J].河南师范大学学报（自然科学版）,2018,46(1):16-22. 被引量：3
7吴雨茜,王俊丽,杨丽,余淼淼.代价敏感深度学习方法研究综述[J].计算机科学,2019,46(5):1-12. 被引量：20
8王茜竹,徐瑞,江德潮,雒江涛.基于多源数据的出行安全时空评价模型研究[J].重庆邮电大学学报（自然科学版）,2019,31(5):618-627. 被引量：2
9牛硕硕,柴小丽,李德启,谢彬.一种基于神经网络与LDA的文本分类算法[J].计算机工程,2019,45(10):208-214. 被引量：11
10丁建立,苏现帅.基于组合式深度学习网络的混合文本情感分类[J].计算机工程与设计,2019,40(11):3254-3258. 被引量：8

引证文献2

1倪锦园,张建勋.点格棋计算机博弈系统的设计与实现[J].现代信息科技,2021,5(9):78-82. 被引量：2
2袁同庆,席鹏.基于多模态音视频融合的质量评价算法[J].沈阳工业大学学报,2022,44(3):331-335. 被引量：2

二级引证文献4

1李东轩,胡伟,王静文.基于Alpha-Beta算法的苏拉卡尔塔棋博弈系统研究[J].智能计算机与应用,2022,12(2):123-125. 被引量：1
2靳淑娴,高铭,王修锴.开局库在点格棋计算机博弈系统中的应用[J].数字技术与应用,2022,40(1):61-63.
3汪滢.基于数据挖掘技术的高校教学质量评估算法[J].数字通信世界,2022(10):191-193. 被引量：2
4赵雪,高颂华.增强现实研旅产品的多模态具身参与度评价方法研究[J].包装工程,2024,45(16):150-159.

1邬佩华.基于幼儿经验的益智区材料投放策略——由“俄罗斯方块”引发的深度思考[J].今日教育（幼教金刊）,2021(1):32-34. 被引量：1
2张宜放,孟坤.基于点格棋的UCT算法研究与分析[J].智能计算机与应用,2020(4):27-31. 被引量：3
3蔡瑞云.提高小班幼儿教育有效性的策略研究[J].新教育（海南）,2021(1):76-77.
4胡耀宇.得意的妙手组合[J].围棋天地,2021(6):83-85.
5沈青.幼儿园艺术课程游戏化教学问题及对策分析[J].读与写（中旬）,2021(3):347-347.
6本刊社.刘诗雯伤愈复出:将自己当成小队员从零开始[J].当代体育,2021(6):8-8.
7沈卓卿.那些年报过的兴趣班[J].幼儿教育,2021(11):13-14.
8阿拉腾格力和.在幼儿园数学教学中绘本的运用探究[J].人物画报（中旬刊）,2020(6):0187-0187.
9王锦妍,刘智慧,代志刚.基于对数函数稀疏约束的随机缺失地震数据的重建[J].地球物理学进展,2020,35(6):2228-2238. 被引量：4
10王莉.孩子,你要输得起[J].家庭教育（中小学版）,2021(3):17-19.

小型微型计算机系统

2021年第3期

浏览历史

内容加载中请稍等...

一种自对弈棋局学习样例质量评价方法被引量：2

参考文献3

二级参考文献16

共引文献6

同被引文献13

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种自对弈棋局学习样例质量评价方法 被引量：2

参考文献3

二级参考文献16

共引文献6

同被引文献13

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种自对弈棋局学习样例质量评价方法被引量：2