期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于演化博弈惩罚机制的多智能体协作稳定性研究 被引量:3
1
作者 郑延斌 段领玉 +1 位作者 李波 梁凯 《计算机工程与科学》 CSCD 北大核心 2015年第9期1682-1687,共6页
针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并... 针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。 展开更多
关键词 演化博弈 协作 惩罚机制 信誉值 MULTI-AGENT
下载PDF
基于博弈论及惩罚机制的多Agent协作控制算法 被引量:2
2
作者 郑延斌 陶雪丽 +1 位作者 段领玉 李波 《河南师范大学学报(自然科学版)》 CAS 北大核心 2015年第6期146-151,共6页
针对协作过程中自利的Agent选择回报更高的任务去执行,导致当前任务不能正常执行的问题,提出一种基于博弈论及惩罚机制的协作控制方法.在形成协作时优先选择信誉值较高的Agent,在协作执行过程中利用惩罚机制来约束退出协作的Agent的行为... 针对协作过程中自利的Agent选择回报更高的任务去执行,导致当前任务不能正常执行的问题,提出一种基于博弈论及惩罚机制的协作控制方法.在形成协作时优先选择信誉值较高的Agent,在协作执行过程中利用惩罚机制来约束退出协作的Agent的行为.仿真结果表明,该算法能有效地避免Agent在协作中随意的退出,确保协作任务的顺利执行,提高协作成功率. 展开更多
关键词 博弈论 协作 惩罚机制 信誉值 MULTI-AGENT
下载PDF
基于博弈学习的多Agent城市交通协调控制 被引量:3
3
作者 郑延斌 王宁 段领玉 《计算机应用》 CSCD 北大核心 2014年第2期601-604,共4页
交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上,利用博弈学习思想,构建多智能体(multi-Agent)博弈学习协调算法,利用此学习协调算法对出行者行为分析并修正,实现城市交通路口的畅通,进而达到区域、全局的交通... 交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上,利用博弈学习思想,构建多智能体(multi-Agent)博弈学习协调算法,利用此学习协调算法对出行者行为分析并修正,实现城市交通路口的畅通,进而达到区域、全局的交通优化。最后通过实例仿真验证其可行性。 展开更多
关键词 有限理性 博弈学习 多智能体 协调算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部