期刊文献+

跳棋系统中的关键算法

下载PDF
导出
摘要 计算机博弈是当下在人工智能范畴内一个十分重要并且十分有挑战性的课题,是人工智能领域的重要分支。人工智能在棋类游戏中的应用十分广泛。目前,对于五子棋,国际象棋,中国象棋等棋牌类游戏的计算机博弈软件有很多且智能水平都相对较高,而高水平跳棋软件在国内并不多见。该文在对大量相关文献的分析和研究的基础上,具体研究了跳棋博弈软件的博弈树搜索算法、评估函数。提出了三种不同搜索效率的算法来实现分级博弈,评估算法使用TD-BP算法。论文主要研究了以下几个方面的问题:第一,根据走法生成所构造的博弈树,研究了一些广泛使用的博弈树搜索算法,并介绍了一些改进的搜索算法,在设计中结合部分搜索算法进行使用。第二,研究了主要包括静态估值函数和其他具有机器自学习能力的评估函数,在实际设计中,将BP神经网络与增强学习算法结合使用。
作者 张阳 黎素珍
出处 《电脑知识与技术》 2016年第11X期70-73,77,共5页 Computer Knowledge and Technology
  • 相关文献

参考文献3

二级参考文献17

  • 1Narendra P,Sandip S,Maria Gordin.Shared memory based cooperative coevolution[C].In:Proceedings of the 1998 IEEE International Conference on Evolutionary Computation.Alaska,IEEE Press, 1998:570-574.
  • 2M L Littman.Markov games as a framework for multiagent reinforcement leaming[C].In :Proceedings of the 11th International conference on Machine learning,1994.
  • 3Kaelbling L P,Littman M L,Moore A W.Reinforcement learning:A survey[C].In :Journal of AI Research,4:237-285.
  • 4Sandip Sen-Chair.Adaption,Coevolution and Learning in Multiagent Systems:Papers from the 1996 AAAI Spring Symposium[R].AAAI Press, AAAI Technical Report SS-96-01.
  • 5Weiss G,Dillenbourg P.What is multi in multiagent learning?Dillenbourg P,Collaborative learning,cognitive and computational approaches. Amsterdam:Pergamon Press, 1998:64-80.
  • 6M L Littman.Friend-or-foe :Q-learnlng in general-sum games[C].In: Proceedings of the Eighteenth International Conference on Machine Learning,2001.
  • 7J Hu.Best-response algorithm for muhiagent reinforcement learning. 2003.
  • 8Tom M Mitchell.Machine learning.McGraw-Hill Companies,Inc.1997: 367-387.
  • 9Watkins C,Dayan P.Q-learning.Maehine learning,8,1992:279-292.
  • 10Corten E,Dorer K,Heintz F et al.Soccer server manual.Robocup Federation.http ://www.robocup.org, 2003.

共引文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部