期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于演化博弈惩罚机制的多智能体协作稳定性研究
被引量:
3
1
作者
郑延斌
段领玉
+1 位作者
李波
梁凯
《计算机工程与科学》
CSCD
北大核心
2015年第9期1682-1687,共6页
针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并...
针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。
展开更多
关键词
演化博弈
协作
惩罚机制
信誉值
MULTI-AGENT
下载PDF
职称材料
基于博弈论及惩罚机制的多Agent协作控制算法
被引量:
2
2
作者
郑延斌
陶雪丽
+1 位作者
段领玉
李波
《河南师范大学学报(自然科学版)》
CAS
北大核心
2015年第6期146-151,共6页
针对协作过程中自利的Agent选择回报更高的任务去执行,导致当前任务不能正常执行的问题,提出一种基于博弈论及惩罚机制的协作控制方法.在形成协作时优先选择信誉值较高的Agent,在协作执行过程中利用惩罚机制来约束退出协作的Agent的行为...
针对协作过程中自利的Agent选择回报更高的任务去执行,导致当前任务不能正常执行的问题,提出一种基于博弈论及惩罚机制的协作控制方法.在形成协作时优先选择信誉值较高的Agent,在协作执行过程中利用惩罚机制来约束退出协作的Agent的行为.仿真结果表明,该算法能有效地避免Agent在协作中随意的退出,确保协作任务的顺利执行,提高协作成功率.
展开更多
关键词
博弈论
协作
惩罚机制
信誉值
MULTI-AGENT
下载PDF
职称材料
基于博弈学习的多Agent城市交通协调控制
被引量:
3
3
作者
郑延斌
王宁
段领玉
《计算机应用》
CSCD
北大核心
2014年第2期601-604,共4页
交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上,利用博弈学习思想,构建多智能体(multi-Agent)博弈学习协调算法,利用此学习协调算法对出行者行为分析并修正,实现城市交通路口的畅通,进而达到区域、全局的交通...
交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上,利用博弈学习思想,构建多智能体(multi-Agent)博弈学习协调算法,利用此学习协调算法对出行者行为分析并修正,实现城市交通路口的畅通,进而达到区域、全局的交通优化。最后通过实例仿真验证其可行性。
展开更多
关键词
有限理性
博弈学习
多智能体
协调算法
下载PDF
职称材料
题名
基于演化博弈惩罚机制的多智能体协作稳定性研究
被引量:
3
1
作者
郑延斌
段领玉
李波
梁凯
机构
河南师范大学计算机与信息工程学院
智慧商务与物联网技术河南省工程实验室
出处
《计算机工程与科学》
CSCD
北大核心
2015年第9期1682-1687,共6页
基金
河南省重点科技攻关项目(122102210086
132102210537
132102210538)
文摘
针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。
关键词
演化博弈
协作
惩罚机制
信誉值
MULTI-AGENT
Keywords
evolutionary games
cooperation
punishment mechanism
credit value
multi-agent
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于博弈论及惩罚机制的多Agent协作控制算法
被引量:
2
2
作者
郑延斌
陶雪丽
段领玉
李波
机构
河南师范大学计算机与信息工程学院
河南师范大学智慧商务与物联网技术河南省工程实验室
出处
《河南师范大学学报(自然科学版)》
CAS
北大核心
2015年第6期146-151,共6页
基金
河南省重点科技攻关项目(132102210537
13210221053)
文摘
针对协作过程中自利的Agent选择回报更高的任务去执行,导致当前任务不能正常执行的问题,提出一种基于博弈论及惩罚机制的协作控制方法.在形成协作时优先选择信誉值较高的Agent,在协作执行过程中利用惩罚机制来约束退出协作的Agent的行为.仿真结果表明,该算法能有效地避免Agent在协作中随意的退出,确保协作任务的顺利执行,提高协作成功率.
关键词
博弈论
协作
惩罚机制
信誉值
MULTI-AGENT
Keywords
game theory
cooperation
punishment mechanism
credit value
multi-Agent
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于博弈学习的多Agent城市交通协调控制
被引量:
3
3
作者
郑延斌
王宁
段领玉
机构
河南师范大学计算机与信息工程学院
出处
《计算机应用》
CSCD
北大核心
2014年第2期601-604,共4页
基金
河南省重点科技攻关项目(122102210086
132102210537
132102210538)
文摘
交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上,利用博弈学习思想,构建多智能体(multi-Agent)博弈学习协调算法,利用此学习协调算法对出行者行为分析并修正,实现城市交通路口的畅通,进而达到区域、全局的交通优化。最后通过实例仿真验证其可行性。
关键词
有限理性
博弈学习
多智能体
协调算法
Keywords
bounded rationality
game learning
multi-Agent
coordination algorithm
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于演化博弈惩罚机制的多智能体协作稳定性研究
郑延斌
段领玉
李波
梁凯
《计算机工程与科学》
CSCD
北大核心
2015
3
下载PDF
职称材料
2
基于博弈论及惩罚机制的多Agent协作控制算法
郑延斌
陶雪丽
段领玉
李波
《河南师范大学学报(自然科学版)》
CAS
北大核心
2015
2
下载PDF
职称材料
3
基于博弈学习的多Agent城市交通协调控制
郑延斌
王宁
段领玉
《计算机应用》
CSCD
北大核心
2014
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部