摘要
将预测分析技术和强化学习技术有机结合,使多Agent系统中的各Agent,不仅具有了高度反应自适应性,而且拥有了高效而准确的预测分析能力;使Agent的行为更具有针对性,尽可能地减少错误,保证学习的正确方向,提高Agent间进行信息共享,融合单个Agent的Q值表。相当于相同情况下增加了学习次数,不仅尽可能地消除策略中的冗余动作,以高效的方式实现最终目标,而且提高多Agent系统执行效率和收敛速度及性能。本文提出了一种改进的多Agent间协作学习方法,适用于环境不完备的复杂情况。以追捕问题作为仿真实验。结果表明所提方法能够有效地促进多智能体系统中各Agent间协作学习能力。
出处
《科技创新导报》
2011年第9期253-254,共2页
Science and Technology Innovation Herald