跳棋系统中的关键算法

下载PDF

导出

摘要计算机博弈是当下在人工智能范畴内一个十分重要并且十分有挑战性的课题,是人工智能领域的重要分支。人工智能在棋类游戏中的应用十分广泛。目前,对于五子棋,国际象棋,中国象棋等棋牌类游戏的计算机博弈软件有很多且智能水平都相对较高,而高水平跳棋软件在国内并不多见。该文在对大量相关文献的分析和研究的基础上,具体研究了跳棋博弈软件的博弈树搜索算法、评估函数。提出了三种不同搜索效率的算法来实现分级博弈,评估算法使用TD-BP算法。论文主要研究了以下几个方面的问题:第一,根据走法生成所构造的博弈树,研究了一些广泛使用的博弈树搜索算法,并介绍了一些改进的搜索算法,在设计中结合部分搜索算法进行使用。第二,研究了主要包括静态估值函数和其他具有机器自学习能力的评估函数,在实际设计中,将BP神经网络与增强学习算法结合使用。

作者张阳黎素珍

机构地区公安部第三研究所

出处《电脑知识与技术》 2016年第11X期70-73,77,共5页 Computer Knowledge and Technology

关键词计算机博弈搜索算法分级博弈评估函数

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1唐志强,王正武,招晓菊,李宏.基于神经网络和混沌理论的短时交通流预测[J].山西科技,2005(5):117-118. 被引量：4
2郭锐,彭军,吴敏.增强Q学习在非确定马尔可夫系统寻优问题中的应用[J].计算机工程与应用,2005,41(13):36-38. 被引量：4
3李淑琴,李静波,韩裕华,陶思拓.苏拉卡尔塔博弈系统中评估函数的研究[J].北京信息科技大学学报（自然科学版）,2012,27(6):42-45. 被引量：6

二级参考文献17

1Narendra P,Sandip S,Maria Gordin.Shared memory based cooperative coevolution[C].In:Proceedings of the 1998 IEEE International Conference on Evolutionary Computation.Alaska,IEEE Press, 1998:570-574.
2M L Littman.Markov games as a framework for multiagent reinforcement leaming[C].In :Proceedings of the 11th International conference on Machine learning,1994.
3Kaelbling L P,Littman M L,Moore A W.Reinforcement learning:A survey[C].In :Journal of AI Research,4:237-285.
4Sandip Sen-Chair.Adaption,Coevolution and Learning in Multiagent Systems:Papers from the 1996 AAAI Spring Symposium[R].AAAI Press, AAAI Technical Report SS-96-01.
5Weiss G,Dillenbourg P.What is multi in multiagent learning?Dillenbourg P,Collaborative learning,cognitive and computational approaches. Amsterdam:Pergamon Press, 1998:64-80.
6M L Littman.Friend-or-foe :Q-learnlng in general-sum games[C].In: Proceedings of the Eighteenth International Conference on Machine Learning,2001.
7J Hu.Best-response algorithm for muhiagent reinforcement learning. 2003.
8Tom M Mitchell.Machine learning.McGraw-Hill Companies,Inc.1997: 367-387.
9Watkins C,Dayan P.Q-learning.Maehine learning,8,1992:279-292.
10Corten E,Dorer K,Heintz F et al.Soccer server manual.Robocup Federation.http ://www.robocup.org, 2003.

共引文献11

1李东轩,胡伟,王静文.基于Alpha-Beta算法的苏拉卡尔塔棋博弈系统研究[J].智能计算机与应用,2022,12(2):123-125. 被引量：1
2李燕.交通流状态辨识及混沌预测[J].中国科技信息,2007(24):95-96.
3高慧,赵建玉,贾磊.短时交通流预测方法综述[J].济南大学学报（自然科学版）,2008,22(1):88-94. 被引量：47
4李菲,肖洪祥.基于神经动态规划算法的最优路径选择[J].桂林工学院学报,2009,29(1):154-157. 被引量：1
5孟祥萍,王圣镔,王欣欣.多Agent Q学习几点问题的研究及改进[J].计算机工程与设计,2009,30(9):2274-2276. 被引量：5
6孟祥萍,王圣镔,王欣欣.基于蚁群算法和轮盘算法的多Agent Q学习[J].计算机工程与应用,2009,45(16):60-62. 被引量：5
7田保慧,郭彬.基于时空特征分析的短时交通流预测模型[J].重庆交通大学学报（自然科学版）,2016,35(3):105-109. 被引量：10
8张博,李淑琴,李臻.苏拉卡尔塔棋中残局的优化[J].智能计算机与应用,2017,7(1):83-85. 被引量：2
9王亚杰,邱虹坤,吴燕燕,李飞,杨周凤.计算机博弈的研究与发展[J].智能系统学报,2016,11(6):788-798. 被引量：30
10车晓菲,徐勇,蒋宗华.苏拉卡尔塔棋系统的设计与实现[J].信息与电脑,2021,33(6):70-73. 被引量：2

1韩韬.基于安防大门的智能生物识别门禁系统研究[J].轻工科技,2017,33(6):84-86.

电脑知识与技术

2016年第11X期

浏览历史

内容加载中请稍等...

跳棋系统中的关键算法

参考文献3

二级参考文献17

共引文献11

相关作者

相关机构

相关主题

浏览历史