基于个性的群体强化学习算法

Groups reinforcement learning algorithm Based on personality

下载PDF

导出

摘要本文以RoboCup为平台,提出群体强化学习算法,该算法将个性行为绑定到信息Agent上,让具有不同个性的Agent充当合适的角色,基于共同的目标,Agent可能产生共同的意图,规划出共同的行为,使追求个体目标与整体目标能合理协调,性能分析表明本文算法适用于动态、实时、有干扰、对抗的环境中。 This paper presents groups reinforcement learning algorithm to RoboCup as a platform,the algorithm acts will be bundled with personalized information agent,a different personality to the role of agent as appropriate,based on common objectives,common agent may have the intention of planning common the acts in which the pursuit of individual goals and overall objectives reasonable coordination,performance analysis show that the algorithm applied to dynamic,real-time,interference,a confrontational environment.

作者严耀华程显毅韩飞

机构地区江苏大学计算机科学与通信工程学院

出处《微计算机信息》北大核心 2008年第36期259-261,共3页 Control & Automation

基金基于粒子群优化和先验信息的约束学习算法研究颁发部门:国家自然科学基金(60702056) 申请人:韩飞程显毅

关键词个性 AGENT 群体强化学习 ROBOCUP personality Agent Group Reinforcement Learning RoboCup

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1黄伟强,程显毅,张俊.基于个性的MAS默契合作模型[J].微计算机信息,2006,22(09X):305-307. 被引量：1
2SUTTON R S, BARTO A G.Reinforcement learning[M].Cambridge,MA:The MIT Press, 1998
3LAGOUDAKIS,PARR.Value function approximation in zerosum Markov games [C]//The 18th Conf on Uncertainty in Aritificial Intelligence. Alberta:[s.n.],2002
4INGH,KEARNS,Nash convergence of gradient dynamics in general-sum games[C]. The 16th Conf on Uncertainty in Aritificial Intelligence.Los Angeles,CA:[s.n],2000
5BOWLING, VELOSO.Muhiagent learning using a variable learning rate[J].Aritificial Intelligence,2002,136 (2):215-250
6STONE P, VELOSO. Muhiagent systems: a survey from a machine learning perspective [J]. Autonomous Robotics, 2000,8 (3): 345-383

二级参考文献3

1Wooldrige M and Jennings N R. Intelligent agents:theory and practice. The Knowledge Engineering Review, 1995,10(2)115-152.
2徐晋辉张伟.一种具有个性的Agent实现机制[J].计算机研究与分发展,06.
3郭大运,谢列卫,欧长劲,樊洪波.基于Agent的分布式协同设计系统的研究[J].微计算机信息,2003,19(5):64-65. 被引量：14

1杨冬,张宏科,宋飞,李世勇.网络分层优先映射理论[J].中国科学：信息科学,2010,40(5):653-667.
2仲宇,张汝波,顾国昌.分布式强化学习系统的体系结构研究[J].计算机工程与应用,2003,39(11):111-113. 被引量：5
3仲宇,顾国昌,张汝波.多智能体系统中的分布式强化学习研究现状[J].控制理论与应用,2003,20(3):317-322. 被引量：12
4周申培,严新平.信息融合技术在交通流量预测中的应用[J].ITS通讯,2005,7(3):43-45. 被引量：1
5大公司里的邮件办公[J].视窗世界,2005(8):28-29.
6邵磊.通讯信息网络化管理[J].内蒙古石油化工,2005,31(11):55-56. 被引量：1
7迟忠先,杨白新,盖印,翟巍.应用多线程并行机制实现大规模三维场景绘制[J].小型微型计算机系统,2004,25(8):1510-1512. 被引量：4
8李奎,吴立言,刘更.基于EMF和GEF的机械产品仿真流程建模[J].计算机工程,2008,34(18):235-236. 被引量：2
9汤亚玲,崔志明.行为特征分析模式下的网页分类技术研究[J].计算机工程,2012,38(20):179-183. 被引量：2
10许峰.高校图书馆个性化信息服务探讨[J].甘肃科技纵横,2010,39(1):109-110. 被引量：3

微计算机信息

2008年第36期

浏览历史

内容加载中请稍等...

基于个性的群体强化学习算法

参考文献6

二级参考文献3

相关作者

相关机构

相关主题

浏览历史