期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一般和博弈中的合作多agent学习 被引量:7
1
作者 宋梅萍 顾国昌 +1 位作者 张国印 刘海波 《控制理论与应用》 EI CAS CSCD 北大核心 2007年第2期317-321,共5页
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的... 理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能. 展开更多
关键词 多AGENT学习 一般和随机博弈 NASH平衡 PARETO占优 Q-学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部