基于Q学习的Agent智能防守策略研究与应用被引量：6

Research and Application about Defensive Strategy Based on Q Learning

下载PDF

导出

摘要模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化。 As a representative experimental platform of multiagent system, RoboCup（Robot World Cup） by which various theories, algorithms and architectures can be evaluated, has become the research center of artificial intelligence. To rcsolve the problem about defensive strategy of goalie in RoboCup environment, based on 0 learning proposed a method which trained goalie. Confirm the algorithm in RoboCup environment and implement the optimization of defensive strategy about goalie.

作者马勇李龙澍李学俊

机构地区安徽大学计算智能与信号处理教育部重点实验室安徽大学计算机科学与技术学院

出处《计算机技术与发展》 2008年第12期106-108,112,共4页 Computer Technology and Development

基金国家自然科学基金(60273043) 安徽省自然科学基金(050420204) 安徽省教育厅自然科学研究项目(KJ2007B153)

关键词 Q学习智能体机器人足球比赛防守策略 Q learning agent RoboCup defensive strategy

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1Stone P. Layered learning in Multi - Agent System[D]. Pittsburgh: Computer Science Department, Carnegie Mellon University, 1998.
2Mihal B, Kay S, Jan W. Learning of kick in artificial soccer [ C]///Robot Soccer World Cup IV. Berlin: [ s. n. ], 2000.
3Kaelbling LP, Littrnan M L, Moore A W. Reinforcement learning:A survey[J]. Journal of Artificial Intelliegence, 1996, 4:237 - 285.
4Sutton R S, Barto A G. Reinforcement Learning[M]. Cambridge, MA: The MIT Press, 1998.
5孟伟,洪炳熔,韩学东.强化学习在机器人足球比赛中的应用[J].计算机应用研究,2002,19(6):79-81. 被引量：11

二级参考文献2

1蔡庆生,张波.一种基于Agent团队的强化学习模型与应用研究[J].计算机研究与发展,2000,37(9):1087-1093. 被引量：31
2张汝波,顾国昌,刘照德,王醒策.强化学习理论、算法及应用[J].控制理论与应用,2000,17(5):637-642. 被引量：92

共引文献10

1朱伟一.格林斯潘斗不过经济规律[J].南风窗,2002(24):61-61.
2陈雪江,杨东勇.基于强化学习的多智能体协作实现[J].浙江工业大学学报,2004,32(5):516-519. 被引量：2
3陈雪江,杨东勇,范荣真.多智能体协作的两层强化学习实现方法[J].计算机工程,2005,31(3):192-194. 被引量：4
4高建清,王浩,于磊,方宝富.一种模糊强化学习算法及其在RoboCup中的应用[J].计算机工程与应用,2006,42(6):52-54.
5厉广伟,曹爱增,尹建芹.基于视觉的足球机器人决策规划研究进展[J].济南大学学报（自然科学版）,2006,20(2):155-159. 被引量：2
6吴俊,陈焕文,陈鹏慧,蔡琼.激励学习在RoboCup截球技术中的研究[J].微计算机信息,2012(9):469-470.
7刘永军,张国兵,杨明,牛江川,樊金生.基于自适应学习的特征图像识别技术研究[J].计算机应用研究,2003,20(10):84-85.
8刘晋明.智能控制及其在足球机器人中的应用[J].福建电脑,2003(9):6-7.
9张淑军,孟庆春,宋长虹,张艳,张文.多智能体系统混合智能学习算法研究[J].哈尔滨工业大学学报,2003,35(9):1083-1085. 被引量：5
10咸鹤群,孟庆春,殷波,张继军,李占宾.多Agent系统中的潜在角色值研究[J].哈尔滨工业大学学报,2003,35(9):1089-1092. 被引量：2

同被引文献49

1张家旺,韩光胜,张伟.Q学习算法在RoboCup带球中的应用[J].系统仿真技术,2005,1(2):84-87. 被引量：3
2程显毅,张俊,王军.模式识别在RoboCup中的应用[J].江苏大学学报（自然科学版）,2005,26(2):158-161. 被引量：4
3刘亮,李龙澍.基于神经网络的RoboCup进攻策略[J].计算机工程与应用,2005,41(36):44-47. 被引量：4
4卢武昌,胡山立.RoboCup发展与研究综述[J].福建电脑,2006(4):1-2. 被引量：2
5居泽龙,沈建强.模糊控制技术在机器人足球中的应用[J].扬州职业大学学报,2006,10(1):37-41. 被引量：1
6张家旺,韩光胜,张伟.C5.0算法在RoboCup传球训练中的应用研究[J].计算机仿真,2006,23(4):132-134. 被引量：11
7李楠,刘国栋.内在激励强化学习及其在Robocup仿真中的应用[J].计算机仿真,2006,23(4):160-162. 被引量：3
8周浦城,洪炳镕,黄庆成.一种新颖的多agent强化学习方法[J].电子学报,2006,34(8):1488-1491. 被引量：8
9贺建民,闵锐.多Agent系统中蚁群算法的设计与实现[J].微电子学与计算机,2006,23(10):32-34. 被引量：4
10张振文,程显毅,李明.分布式强化学习在RoboCup中的应用[J].现代电子技术,2007,30(4):44-46. 被引量：1

引证文献6

1李龙澍,葛瑞峰,王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,19(7):98-101. 被引量：3
2申迅,刘国栋.基于Q学习Robocup前锋的射门训练[J].计算机工程与应用,2011,47(18):53-55.
3韦庆丹,陈焕文,陈鹏慧,蔡琼.强化学习在机器人足球半场进攻中的应用[J].微计算机信息,2011,27(12):104-105. 被引量：1
4黄颖,陈玮.RoboCup 2D仿真球员射门技能中智能算法的应用综述[J].电子世界,2012(5):80-83.
5付鹏,罗杰.基于改进蚁群算法的Q学习算法研究[J].计算机技术与发展,2013,23(2):123-126. 被引量：1
6章惠龙,李龙澍.Q学习在RoboCup前场进攻动作决策中的应用[J].计算机工程与应用,2013,49(7):240-242. 被引量：6

二级引证文献10

1李瑾,刘全,杨旭东,杨凯,翁东良.一种改进的平均奖赏强化学习方法在RoboCup训练中的应用[J].苏州大学学报（自然科学版）,2012,28(2):21-26. 被引量：2
2黄颖,陈玮.RoboCup 2D仿真球员射门技能中智能算法的应用综述[J].电子世界,2012(5):80-83.
3王婕,陈玮.RoboCup2D仿真的若干评价指标的权重研究[J].计算机应用与软件,2012,29(3):112-114.
4李学俊,陈士洋.RoboCup仿真2D实验平台[J].实验室研究与探索,2014,33(4):58-61. 被引量：3
5李木军,刘箴,林君焕,于力鹏.基于情感计算和Q-learning的agent自主追逐行为过程研究[J].计算机应用研究,2014,31(6):1710-1713. 被引量：3
6赵发君,李龙澍.基于多Agent Q学习的RoboCup局部配合策略[J].计算机工程与应用,2014,50(23):127-130. 被引量：2
7Lin Zhang,Kaili Rao,Ruchuan Wang.T-QoS-aware based parallel ant colony algorithm for services composition[J].Journal of Systems Science & Complexity,2015,28(5):1100-1106. 被引量：2
8陈冰,许非凡,徐涵延,程泽凯,刘诚.Robocup2D项目中Agent2D底层动作链机制的分析优化[J].系统仿真学报,2017,29(11):2782-2787. 被引量：4
9朱振国,赵凯旋,刘民康.基于强化学习的特征选择算法[J].计算机系统应用,2018,27(10):214-218. 被引量：3
10杨建,王萍,于雅鑫,高买军.基于RoboCup2D仿真的球队策略研究[J].计算机系统应用,2022,31(1):295-302.

1Jiang Liangui.DATE WITH ‘WORLD CUP＇[J].重庆与世界（Hello重庆）,2014(12):6-6.
2李龙澍,葛瑞峰,王慧萍.基于神经网络的批强化学习在Robocup中的应用[J].计算机技术与发展,2009,19(7):98-101. 被引量：3
3郭博,程家兴.RoboCup仿真组中Agent的流程设计[J].合肥学院学报（自然科学版）,2005,15(3):47-49.
4马勇,李龙澍,李学俊.基于动态目标驱动的RoboCup进攻策略的研究[J].计算机技术与发展,2008,18(1):84-86.
5周勇,刘锋.基于改进的Q学习的RoboCup传球策略研究[J].计算机技术与发展,2008,18(4):63-66. 被引量：8
6陈勇,温雅.基于动态窗口的足球机器人搜索算法研究[J].数字技术与应用,2013,31(6):133-133. 被引量：1
7姜浩,岳继光,胡龙达.用于汽车耐久性试验的驾驶机器人模糊控制仿真[J].系统仿真技术,2013,9(1):61-65. 被引量：3
8刘亮,李龙澍.基于神经网络的RoboCup进攻策略[J].计算机工程与应用,2005,41(36):44-47. 被引量：4
9宋遥,李国名,徐丽.采用蚁群算法模拟机器人寻路的仿真实验[J].河北工业科技,2010,27(5):340-343. 被引量：2
10贺建立.RoboCup仿真足球设计[J].软件导刊,2006,5(3):31-32. 被引量：1

计算机技术与发展

2008年第12期

浏览历史

内容加载中请稍等...

基于Q学习的Agent智能防守策略研究与应用被引量：6

参考文献5

二级参考文献2

共引文献10

同被引文献49

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于Q学习的Agent智能防守策略研究与应用 被引量：6

参考文献5

二级参考文献2

共引文献10

同被引文献49

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于Q学习的Agent智能防守策略研究与应用被引量：6