改进UCT算法在爱恩斯坦棋中的应用被引量：8

Application of Improved UCT Algorithm in EinStein Würfelt Nicht!Computer Game

下载PDF

导出

摘要 UCT(Upper Confidence Bound Apply to Tree)算法是蒙特卡罗搜索算法的延展,因其鲁棒性强而受到广泛关注,且被应用于计算机博弈系统。爱恩斯坦棋是近年国内博弈大赛引进的新棋种,在竞赛中投骰子所引发的随机性和娱乐性吸引了广大学者的目光。从全局优化着法角度出发,在爱恩斯坦棋博弈系统中引入UCT算法。首先,针对当前计算机多核现状,利用并行计算方法进一步优化UCT算法;其次,针对UCT算法的最优着法需求,引入当前估值因子(WINK)和次优节点平衡因子(UCTK),以此辅助增加估值的精确度,决策胜率与着法的优先关系,提高算法的收敛效率;最后,构造了爱恩斯坦棋博弈系统,通过与基于极大极小算法、α-β算法以及蒙特卡罗算法的爱恩斯坦棋博弈系统进行机-机对弈,其胜率提高了25%,并在全国计算机博弈大赛中获冠军,这进一步验证了改进算法的有效性。 UCT(Upper Confidence Bound Apply to Tree)algorithm,as the extension of Monte Carlo search algorithm,is widely concerned and applied to computer game system because of its strong robustness.EinStein würfelt nicht!game is a new kind of game introduced in the domestic game competition in recent years,and the randomness and entertainment of throwing the dice in the competition attracts the participation of the majority of scholars.From the perspective of global optimization method,UCT algorithm was introduced to apply in EinStein würfelt nicht!game system.Firstly,the UCT algorithm is further optimized by using the parallel computing method based on the current state of multi-core computer.Secondly,the current winning factor(WINK)and the optimal node selection factor(UCTK)are introduced to optimize the optimal relationship between the decision winning percentage and the move.Finally,a complete EinStein würfelt nicht!game system is constructed.The winning percentage is improved by 25%by computer-computer game with the game system based on the Minimax algorithm,α-βalgorithm and Monte Carlo algorithm,and it has won the champion in the National Computer Game Contest,which further validates the effectiveness of the algorithm.

作者张小川李琴南海彭丽蓉 ZHANG Xiao-chuan;LI Qin;NAN Hai;PENG Li-rong(College of Computer Science and Engineering,Chongqing University of Technology,Chongqing 400054,China;Scientific Research Department,Chongqing Industry Polytechnic College,Chongqing 401120,China)

机构地区重庆理工大学计算机科学与工程学院重庆工业职业技术学院科研处

出处《计算机科学》 CSCD 北大核心 2018年第12期196-200,共5页 Computer Science

基金国家自然科学基金-青年科学基金项目(61502065) 重庆市基础科学与前沿技术研究计划项目(cstc2015jcyjA40041) 重庆市重庆理工大学研究生创新基金(YCX2016238)资助

关键词 UCT算法爱恩斯坦棋并行计算平衡优化 UCT algorithm EinStein würfelt nicht!game Parallel computing Balance optimization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1王亚杰,邱虹坤,吴燕燕,李飞,杨周凤.计算机博弈的研究与发展[J].智能系统学报,2016,11(6):788-798. 被引量：30
2Yue Wang,Shoudong Huang,Rong Xiong,Jun Wu.A framework for multi-session RGBD SLAM in low dynamic workspace environment[J].CAAI Transactions on Intelligence Technology,2016,1(1):90-103. 被引量：3
3周文敏,李淑琴.爱恩斯坦棋静态攻防策略的研究[J].电脑知识与技术（过刊）,2014,20(2X):1027-1031. 被引量：3
4李占宇,李淑琴,顾磊,史玉峰,周文敏.爱恩斯坦棋算法设计与分析[J].信息技术与信息化,2014(1):107-110. 被引量：4
5郭潇逍,李程,梅俏竹.深度学习在游戏中的应用[J].自动化学报,2016,42(5):676-684. 被引量：22
6周洋,邓莉,谢煜.一种五子棋博弈算法的分析[J].现代计算机,2017,23(7):8-10. 被引量：6
7王亚杰,王晓岩,邱虹坤,徐晗.基于爱恩斯坦棋的程序设计课程教学案例设计[J].计算机教育,2012(18):75-77. 被引量：7
8朱龙梅.浅论人工智能启发式搜索策略的研究[J].电子设计工程,2013,21(16):61-64. 被引量：5
9李学俊,王小龙,吴蕾,刘慧婷.六子棋中基于局部“路”扫描方式的博弈树生成算法[J].智能系统学报,2015,10(2):267-272. 被引量：8
10芮雄星,王一莉.UCT-RAVE算法在多人非完备信息博弈中的应用[J].计算机工程与设计,2012,33(3):1136-1139. 被引量：1

二级参考文献139

1何大华,陈传波.关于桥牌的取胜策略[J].华中科技大学学报（自然科学版）,2004,32(7):13-15. 被引量：6
2孙伟,马绍汉.博弈树搜索算法设计和分析[J].计算机学报,1993,16(5):361-369. 被引量：5
3王骄,王涛,罗艳红,徐心和.中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J].东北大学学报（自然科学版）,2005,26(10):949-952. 被引量：16
4徐心和,王骄.中国象棋计算机博弈关键技术分析[J].小型微型计算机系统,2006,27(6):961-969. 被引量：61
5徐长明,南晓斐,王骄,徐心和.中国象棋机器博弈的时间自适应分配策略研究[J].智能系统学报,2006,1(2):39-43. 被引量：2
6魏钦刚,王骄,徐心和,南晓斐.中国象棋计算机博弈开局库研究与设计[J].智能系统学报,2007,2(1):85-89. 被引量：5
7LIU Zhi-qing,DOU Qing.Automatic pattern acquisition from game records in GO[J].The Journal of China Universities of Posts and Telecommunications,2007,14(1):100-105. 被引量：1
8Sturtevant N R,Bowling M H.Robust game play against un-known opponents[C].Proceedings of the Fifth InternationalJoint Conference on Autonomous Agents and Multiagent Sys-tems.USA:ACM,2006:713-719.
9Sturtevant N R.An analysis of UCT in multi-player games[C].Proceedings of the 6th International Conference on Com-puters and Games.Berlin:Springer,2008:37-49.
10Chaslot G,Saito J T,Bouzy B,et al.Monte-Carlo strategies forcomputer go[C].Proceedings of the 18th BeNeLux Conference onArtificial Intelligence.Park:AAAI Press,2006:83-91.

共引文献74

1王亚杰,王晓岩,邱虹坤,李飞.建设棋牌谱标准构建计算机博弈竞赛持续发展新生态[J].实验技术与管理,2020,37(2):19-23. 被引量：3
2欧宇,李媛,王静文,黄常卢.UCT算法在爱恩斯坦棋中的应用研究[J].计算机应用研究,2020,37(S01):147-148. 被引量：2
3沈大旺.基于人工智能的五子棋搜索算法[J].产业与科技论坛,2020,19(1):73-74. 被引量：1
4焦连庆,于敏,黄青,张志伟,何亚全.TAME法测定金龙消栓合剂中吲激酶单位效价[J].中草药,2000,31(4):267-268. 被引量：3
5张慧娟,方灶军,杨桂林.动态环境下基于线特征的RGB-D视觉里程计[J].机器人,2019,41(1):75-82. 被引量：18
6马旭,王大勇.趣味智能模拟程序设计实例[J].计算机与数字工程,2016,44(5):979-982. 被引量：2
7王庆福.基于神经网络的深度学习方法研究[J].电脑编程技巧与维护,2016(12):49-50. 被引量：1
8赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：131
9王亚杰,邱虹坤,尹航,徐晗,张洁.计算机博弈竞赛与创新人才培养模式改革[J].实验技术与管理,2016,33(10):10-14. 被引量：15
10李飞,王亚杰,尹航,孙玉霞.基于幻影围棋的C语言课程教学案例设计[J].计算机教育,2016(10):117-119. 被引量：6

同被引文献27

1欧宇,李媛,王静文,黄常卢.UCT算法在爱恩斯坦棋中的应用研究[J].计算机应用研究,2020,37(S01):147-148. 被引量：2
2周明明,高航,赵国安.UCT算法在计算机围棋中的应用与改进[J].数据采集与处理,2012,27(S2):330-335. 被引量：3
3徐心和,王骄.中国象棋计算机博弈关键技术分析[J].小型微型计算机系统,2006,27(6):961-969. 被引量：61
4徐心和,邓志立,王骄,徐长明,刘纪红,马宗民.机器博弈研究面临的各种挑战[J].智能系统学报,2008,3(4):288-293. 被引量：41
5焦尚彬,刘丁.博弈树置换表启发式算法研究[J].计算机工程与应用,2010,46(6):42-45. 被引量：7
6吕艳辉,宫瑞敏.计算机博弈中估值算法与博弈训练的研究[J].计算机工程,2012,38(11):163-166. 被引量：9
7李占宇,李淑琴,顾磊,史玉峰,周文敏.爱恩斯坦棋算法设计与分析[J].信息技术与信息化,2014(1):107-110. 被引量：4
8胡裕靖,高阳,安波.不完美信息扩展式博弈中在线虚拟遗憾最小化[J].计算机研究与发展,2014,51(10):2160-2170. 被引量：8
9张洛兵,徐流沙,吴梅.基于改进人工蜂群算法的无人机实时航迹规划[J].飞行力学,2015,33(1):38-42. 被引量：12
10鱼佳欣,李刚,李东涛,李文君.改进量子遗传算法在无人机航迹规划中的应用[J].计算机仿真,2015,32(5):106-109. 被引量：14

引证文献8

1焦连庆,于敏,黄青,张志伟,何亚全.TAME法测定金龙消栓合剂中吲激酶单位效价[J].中草药,2000,31(4):267-268. 被引量：3
2郜少波,程精涛.起重机主梁轻量优化精确建模与智能求解方法[J].机械设计与制造,2020(8):131-135. 被引量：1
3向宇涛,朱道易,王忠桃,董羽.基于强化学习的爱因斯坦棋的算法研究[J].电脑知识与技术,2020,16(22):179-181.
4王亚杰,丁傲冬,祁冰枝,张云博.基于预期收益策略与UCT的德州扑克算法[J].重庆理工大学学报（自然科学）,2021,35(3):166-173. 被引量：3
5王亚杰,祁冰枝,张云博,丁傲冬.结合神经网络的改进UCT在国际跳棋中的应用[J].重庆理工大学学报（自然科学）,2021,35(7):259-265. 被引量：5
6管延霞,刘逊韵,刘运韬,谢旻,徐新海.面向多智能体博弈的并行蒙特卡洛树搜索算法研究[J].计算机工程与科学,2022,44(12):2128-2133. 被引量：3
7蔡彪,徐昕怡,谢婷,胡洋成.改进深度神经网络在爱恩斯坦棋中的应用研究[J].重庆理工大学学报（自然科学）,2024,38(5):108-114.
8孙嘉明,胡光元,王佳宁,岳海龙,张杰斯.基于改进UCT算法的爱恩斯坦棋博弈设计研究[J].移动信息,2024,46(10):246-248.

二级引证文献15

1董培智,朴晋华,党爱华,王婷婷,张蕻,张志伟.量反应平行线法在溶栓胶囊蚓激酶效价测定方法学研究中的应用[J].中国中药杂志,2010,35(11):1410-1414. 被引量：17
2张晓丽,杨洪武,吴品昌.蚯蚓用于抗血栓的加工方法[J].中国实验方剂学杂志,2011,17(22):24-26. 被引量：3
3邱虹坤,郑晓东,王亚杰.基于数据库和经验分析的桥牌混合策略打牌模型[J].重庆理工大学学报（自然科学）,2021,35(12):134-139. 被引量：2
4吴立成,吴启飞,钟宏鸣,李霞丽.“拱猪”游戏的深度蒙特卡洛博弈算法[J].重庆理工大学学报（自然科学）,2022,36(12):121-128. 被引量：2
5刘溜,张小川,彭丽蓉,田震,万家强,任越.一种结合策略价值网络的五子棋自博弈方法研究[J].重庆理工大学学报（自然科学）,2022,36(12):129-135. 被引量：3
6邱虹坤,郑晓东,王亚杰.引入合作竞争关系的桥牌叫牌数据库构建[J].重庆理工大学学报（自然科学）,2022,36(12):142-147. 被引量：1
7李淑琴,李奕.一种多重优先经验回放的麻将游戏数据利用方法[J].重庆理工大学学报（自然科学）,2022,36(12):162-169. 被引量：2
8陈泰锟,周转,罗正帮,周焕林.基于生物地理学算法的桁架结构优化[J].机械设计与制造工程,2023,52(6):33-38.
9王春光,许乐,蔡立言,徐勇.一种多阶段对抗博弈的合成火力分配方法[J].兵器装备工程学报,2023,44(7):178-188.
10刘晓枫,刘广玉.温针灸辅以星蒌承气汤治疗老年脑梗死的疗效及对患者神经功能、氧化应激指标、血清可溶性E选择素和肿瘤坏死因子-α的影响[J].中国老年学杂志,2023,43(15):3626-3629. 被引量：9

1阿杜.一场持久的青春对弈[J].少年大世界（初中生）,2018,0(12):8-14.
2沈国清,杨杰栋,陈栋,刘伟龙,张世平,安连锁.基于二次相关PHAT-β算法的锅炉声学测温时延估计研究[J].动力工程学报,2018,38(8):617-623. 被引量：7
3胡煜清.最好的安排[J].围棋天地,2018,0(23):93-93.
4王卉.我国金融服务贸易开放政策的形成机制探究——基于双层博弈视角[J].北方经贸,2018(4):11-13. 被引量：1
5胡煜清.联棋[J].围棋天地,2018,0(22):91-91.
6王孝松,田思远.美国重返TPP的动机和可能性分析[J].政治经济学评论,2018,9(4):167-185. 被引量：8
7刘淑琴,刘淑英.基于博弈树搜索算法的中国象棋游戏的设计与实现[J].自动化与仪器仪表,2017(10):96-98. 被引量：4
8兰志.见二小童校门外路边下棋[J].中华诗词,2018(12):27-27.
9吴真如.美国近期贸易政策转向及对中国影响[J].当代经济科学,2018,40(4):13-20. 被引量：1
10戴晓琦.叙利亚问题大国博弈图景及其展望[J].阿拉伯研究论丛,2016(1):21-33.

计算机科学

2018年第12期

浏览历史

内容加载中请稍等...

改进UCT算法在爱恩斯坦棋中的应用被引量：8

参考文献11

二级参考文献139

共引文献74

同被引文献27

引证文献8

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

改进UCT算法在爱恩斯坦棋中的应用 被引量：8

参考文献11

二级参考文献139

共引文献74

同被引文献27

引证文献8

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

改进UCT算法在爱恩斯坦棋中的应用被引量：8