期刊文献+

基于Q学习的Agent智能防守策略研究与应用 被引量:6

Research and Application about Defensive Strategy Based on Q Learning
下载PDF
导出
摘要 模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化。 As a representative experimental platform of multiagent system, RoboCup(Robot World Cup) by which various theories, algorithms and architectures can be evaluated, has become the research center of artificial intelligence. To rcsolve the problem about defensive strategy of goalie in RoboCup environment, based on 0 learning proposed a method which trained goalie. Confirm the algorithm in RoboCup environment and implement the optimization of defensive strategy about goalie.
出处 《计算机技术与发展》 2008年第12期106-108,112,共4页 Computer Technology and Development
基金 国家自然科学基金(60273043) 安徽省自然科学基金(050420204) 安徽省教育厅自然科学研究项目(KJ2007B153)
关键词 Q学习 智能体 机器人足球比赛 防守策略 Q learning agent RoboCup defensive strategy
  • 相关文献

参考文献5

  • 1Stone P. Layered learning in Multi - Agent System[D]. Pittsburgh: Computer Science Department, Carnegie Mellon University, 1998.
  • 2Mihal B, Kay S, Jan W. Learning of kick in artificial soccer [ C]///Robot Soccer World Cup IV. Berlin: [ s. n. ], 2000.
  • 3Kaelbling LP, Littrnan M L, Moore A W. Reinforcement learning:A survey[J]. Journal of Artificial Intelliegence, 1996, 4:237 - 285.
  • 4Sutton R S, Barto A G. Reinforcement Learning[M]. Cambridge, MA: The MIT Press, 1998.
  • 5孟伟,洪炳熔,韩学东.强化学习在机器人足球比赛中的应用[J].计算机应用研究,2002,19(6):79-81. 被引量:11

二级参考文献2

共引文献10

同被引文献49

引证文献6

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部