期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一般和博弈中的合作多agent学习
被引量:
7
1
作者
宋梅萍
顾国昌
+1 位作者
张国印
刘海波
《控制理论与应用》
EI
CAS
CSCD
北大核心
2007年第2期317-321,共5页
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的...
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
展开更多
关键词
多AGENT学习
一般和随机博弈
NASH平衡
PARETO占优
Q-学习
下载PDF
职称材料
题名
一般和博弈中的合作多agent学习
被引量:
7
1
作者
宋梅萍
顾国昌
张国印
刘海波
机构
哈尔滨工程大学 计算机科学与技术学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2007年第2期317-321,共5页
文摘
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
关键词
多AGENT学习
一般和随机博弈
NASH平衡
PARETO占优
Q-学习
Keywords
multi-agent learning
general-sum game
Nash equilibrium
Pareto optimum
Q-learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一般和博弈中的合作多agent学习
宋梅萍
顾国昌
张国印
刘海波
《控制理论与应用》
EI
CAS
CSCD
北大核心
2007
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部