强化学习在机器人足球半场进攻中的应用被引量：1

Application of Reinforcement Learning in Half Field Offense of Robot Soccer

下载PDF

导出

摘要本文主要研究了强化学习在机器人足球比赛半场进攻中的应用,机器人足球比赛环境状态是一个连续的状态空间,利用强化学习必须将状态空间离散化,文中利用给定的状态变量来描述坏境状态。为了克服机器人单独更新值函数的缺点,采用机器人之间通信的方式来更新所有进攻机器人的值函数,最后将算法在4V5的机器人比赛环境中进行了实验,取得了理想的效果。 This article main introduce the applicatiion of reinforcement learning in half field offense to robot soccer, the environment of robot soccer is a continuous state space, we should discretize the state of environment,we define the state using a set of variables. In order to overcome the shortcoming of the agent update Q value independent, we adopt communication between robots to update Q value of all offense agent.Finally we perform an experiment in 4V5 half field offense, and get an ideal result.

作者韦庆丹陈焕文陈鹏慧蔡琼

机构地区长沙理工大学湖南信息职业技术学院

出处《微计算机信息》 2011年第12期104-105,84,共3页 Control & Automation

关键词强化学习半场进攻机器人通信 Reinforcement Learning Half Field Offense Robot Communication

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1Schivaram kalyanakrishnan, Yanxin Liu, Peter Stone.Half Field Offense in RoboCup Soccer:A Multiagent Reinforcement Learning Case Study [C]. RoboCup-2006:Robot Soccer World Cup X. Springer Verlag, Berlin, 2007.
2Peter Stone, Richard S.Sutton, Gregory Kuhlmann. Reinforce- ment Learning for RoboCup-Soccer Keepaway[J]. Adaptive Behav- ior, 2005, 13(3): 165-188.
3Peter Stone, Richard S.Sutton. Scaling Reinforcement Learning toward RoboCup Soccer [C].In Proceedings of Eighteenth Interna- tional Conference on Machine Learning, MA, 2001.
4戴光耀,康立山.基于遗传算法的智能机器人对抗策略设计[J].微计算机信息,2008,24(35):254-255. 被引量：4
5郑淑丽,韩江洪,骆祥峰,蒋建文.基于强化学习的多Agent协作研究[J].小型微型计算机系统,2003,24(11):1986-1988. 被引量：5
6马勇,李龙澍,李学俊.基于Q学习的Agent智能防守策略研究与应用[J].计算机技术与发展,2008,18(12):106-108. 被引量：6

二级参考文献18

1初永丽.一种GA算法的改进及其实现[J].微计算机信息,2006,22(03S):128-129. 被引量：3
2Stone P. Layered learning in Multi - Agent System[D]. Pittsburgh: Computer Science Department, Carnegie Mellon University, 1998.
3Mihal B, Kay S, Jan W. Learning of kick in artificial soccer [ C]///Robot Soccer World Cup IV. Berlin: [ s. n. ], 2000.
4Kaelbling LP, Littrnan M L, Moore A W. Reinforcement learning:A survey[J]. Journal of Artificial Intelliegence, 1996, 4:237 - 285.
5Sutton R S, Barto A G. Reinforcement Learning[M]. Cambridge, MA: The MIT Press, 1998.
6J. Laird and M. Lent, “Human-level Al's killer application: Interactive computer games,” Al Magazine [J], vol. 22, no. 2, pp. 15-26, 2005.
7http://www - 106.ibm.com/developerworks/java/library/j -robocode 2004.
8M. Mitchell, An Introduction to Genetic Algorithms [M], MIT Press, 1996.
9Richard S. Sutton & Andrew G. Reinforcement learning: an introduction[M]. MIT Press, Cambridge, MA. 1998 A.
10Kaelhling L P, Littman M &Moore A. Reinforcement learning: a survey[J]. Journal of Artificial Intelligence Research. 1994.(4): 237-285.

共引文献12

1党兴华,权小锋,尹洪英.强化学习算法在分阶段组合投资决策中的应用[J].科技管理研究,2006,26(3):241-243. 被引量：1
2李龙澍,葛瑞峰,王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,19(7):98-101. 被引量：3
3刘喜春,王超,王文广,王维平.基于多Agent强化学习的战时备件供应保障动态协调机制[J].空军工程大学学报（自然科学版）,2009,10(3):59-63. 被引量：2
4张煌辉,陈焕文,刘泽文,陈哲平.共享经验分布式Q-学习模型在RoboCup中的应用[J].微计算机信息,2010,26(8):25-26. 被引量：1
5张媛,张广明,袁宇浩.利用聚类分析法改进的多Agent协作强化学习方法[J].计算机测量与控制,2010,18(4):923-926. 被引量：1
6申迅,刘国栋.基于Q学习Robocup前锋的射门训练[J].计算机工程与应用,2011,47(18):53-55.
7黄颖,陈玮.RoboCup 2D仿真球员射门技能中智能算法的应用综述[J].电子世界,2012(5):80-83.
8吴俊,陈焕文,陈鹏慧,蔡琼.激励学习在RoboCup截球技术中的研究[J].微计算机信息,2012(9):469-470.
9刘飞,陈焕文,陈鹏慧,蔡琼.强化学习在RoboCup带球任务中的应用[J].微计算机信息,2012(9):471-472.
10付鹏,罗杰.基于改进蚁群算法的Q学习算法研究[J].计算机技术与发展,2013,23(2):123-126. 被引量：1

同被引文献14

1方宝富,王浩.机器人足球仿真[M].合肥:合肥工业大学出版社,2011.
2Multi-Agent Systems Laboratory of University of Science and Technology of China.WrightEagle 2D Soccer Simulation Team[EB/OL].2013-9-1.http://www.wrighteagle.org/2d.
3Riedmiller M,Gabel T,Hafner R.Reinforcement learning for robot soccer[J].Autonomous Robots,2009,27 (1):55-73.
4Gabel T,Riedmiller M.On Progress in Robocup:the Simulation League Showcase[J].RoboCup-2010:Robot Soccer World Cup XIV,2011,6556:36-47.
5BAI Ai-jun,WU Feng,CHEN Xiao-ping.Towards a Principled Solution to Simulated Robot Soccer[J].RoboCup-2012:Robot Soccer World Cup XVI,Lecture Notes in Artificial Intelligence,2013,7500:1-12.
6BAI Ai-jun,WU Feng,CHEN Xiao-ping.Online planning for large MDPs with MAXQ decomposition[J].AAMAS 2012 Workshop on Autonomous Robots and Multirobot Systems,2012.
7BAI Ai-jun,CHEN Xiao-ping,Patrick MacAlpine.WrightEagle and UT Austin Villa:RoboCup 2011 Simulation League Champions[J].RoboCup-2011:Robot Soccer World Cup XV,Lecture Notes in Computer Science,2012,7416:1-12.
8Bertsekas D.Dynamic Programming and Optimal Control[M].The forth Nashua:Athena Scientific,2012.493-509.
9Hidehisa A.RoboCup Simulation 2D Guide Book[EB/OL].2013-9-1.http://sourceforge.jp/projects/rctools.
10CHEN M,Klaus D,Ehsan F.RoboCup Soccer Server[EB/OL].2013-9-1.http://sourceforge.net/projects/sserver/files.

引证文献1

1李学俊,陈士洋.RoboCup仿真2D实验平台[J].实验室研究与探索,2014,33(4):58-61. 被引量：3

二级引证文献3

1卢建霞,屠大维,赵其杰,许烁.机械工程测试技术实验教学创新平台设计[J].实验室研究与探索,2015,34(4):182-185. 被引量：18
2陈冰,许非凡,徐涵延,程泽凯,刘诚.Robocup2D项目中Agent2D底层动作链机制的分析优化[J].系统仿真学报,2017,29(11):2782-2787. 被引量：4
3杨建,王萍,于雅鑫,高买军.基于RoboCup2D仿真的球队策略研究[J].计算机系统应用,2022,31(1):295-302.

1江玉蓉,吴涛.移动机器人通信平台构建原理与实现方法[J].微机发展,2005,15(2):140-142.
2任志敏.基于USB的FIRA足球机器人通信系统研究[J].自动化技术与应用,2009,28(1):64-66.
3董立岩,郭艳年,李永丽,辛晓华.基于Zigbee的机器人无线通信系统[J].吉林大学学报（信息科学版）,2014,32(4):430-434. 被引量：6
4孙亮,张永强,乔世权.多移动机器人通信技术综述[J].中国科技信息,2008(5):112-114. 被引量：8
5李桂芝,陈细军,杨国胜,谭民,涂序彦.基于CAN总线的自主移动机器人通信系统研究[J].计算机工程与应用,2004,40(19):21-22. 被引量：6
6赵玉良,马昕,周风余,李贻斌.中小学足球机器人系统设计[J].教学仪器与实验（中学版）,2006,22(3):18-20. 被引量：1
7蔡晶.一种基于状态空间离散化的粒子滤波器[J].工业仪表与自动化装置,2010(2):109-111.
8吴楠,郭培源,陈岩,岳明.基于嵌入式Linux的GPRS机器人通信系统研究[J].机器人技术与应用,2007(5):37-40. 被引量：3
9柯文德,彭志平.基于全自主足球机器人系统的KQML语言设计[J].机床与液压,2008,36(6):129-131.
10齐彦龙,向中凡,陈光伟.基于C/S模式的全自主机器人多机通信的研究[J].西华大学学报（自然科学版）,2010,29(1):31-32. 被引量：3

微计算机信息

2011年第12期

浏览历史

内容加载中请稍等...

强化学习在机器人足球半场进攻中的应用被引量：1

参考文献6

二级参考文献18

共引文献12

同被引文献14

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

强化学习在机器人足球半场进攻中的应用 被引量：1

参考文献6

二级参考文献18

共引文献12

同被引文献14

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

强化学习在机器人足球半场进攻中的应用被引量：1