基于演化博弈惩罚机制的多智能体协作稳定性研究被引量：3

Research on multi-agent cooperation stability based on the punishment mechanism of evolutionary games

下载PDF

导出

摘要针对复杂、动态环境中多Agent协作的稳定性问题,提出了一种基于博弈论及惩罚机制的协作方法,通过效用函数来选择最优策略,实现均衡协作;为了提高协作的稳定性与成功率,引入惩罚机制,通过不断调整惩罚系数来维护多Agent协作的稳定性,并在形成协作团队时,充分考虑参与协作的Agent的信誉值。仿真结果表明,该方法能有效地降低任务完成时间,避免Agent在动态协作中随意退出,提高协作效率及协作稳定性。 The coordination stability problem in complex environments is one of the key problems in the research of multi-agent cooperation. We present a multi-agent cooperation stability method on the basis of game theory methods and punishment mechanism. To maintain the stability of multi-agent coop- eration and achieve a balanced cooperation, a punishment is introduced and continuous adjustment of the penalty factors is performed. Agent credit values are fully considered when the cooperation team is formed. Simulation results show that the proposal can not only reduce task completion time effectively, but also avoid agent exits in the dynamic cooperation, thus improving the cooperation efficiency and sta- bility.

作者郑延斌段领玉李波梁凯

机构地区河南师范大学计算机与信息工程学院智慧商务与物联网技术河南省工程实验室

出处《计算机工程与科学》 CSCD 北大核心 2015年第9期1682-1687,共6页 Computer Engineering & Science

基金河南省重点科技攻关项目(122102210086 132102210537 132102210538)

关键词演化博弈协作惩罚机制信誉值 MULTI-AGENT evolutionary games cooperation punishment mechanism credit value multi-agent

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1汤琼,杨东勇.基于协作协进化的多智能体机器人协作研究[J].计算机工程与应用,2004,40(28):64-66. 被引量：3
2唐贤伦,李亚楠,樊峥.未知环境中多Agent自主协作规划策略[J].系统工程与电子技术,2013,35(2):345-349. 被引量：6
3朴松昊,孙立宁,钟秋波,黄庆成.动态环境下的多智能体机器人协作模型[J].华中科技大学学报（自然科学版）,2008,36(S1):39-41. 被引量：6
4任韶萱.蚁群算法在多机器人协作中的应用[J].沈阳理工大学学报,2011,30(5):45-49. 被引量：4

二级参考文献29

1万旭,林健良,杨晓伟.改进的最大-最小蚂蚁算法在有时间窗车辆路径问题中的应用[J].计算机集成制造系统,2005,11(4):572-576. 被引量：43
2李玉坚,刘国栋.一种基于蚁群算法的多机器人协作方法[J].江南大学学报（自然科学版）,2007,6(2):132-135. 被引量：2
3liu G Q, Li T J, Peng Y Q. The Ant Algorithm for Solving Robot Path Planning Problem[ C]. Proceedings of the 3rd International Conference on Information Technology and Applications, 2005, 2:25 -27.
4KriegerM J B, Billeter J B, Keller L. Ant-like Task Allocation and Recruitment in Cooperative Robots [ J ]. Nature, 2000, 406 :992 - 995.
5Dror. Note on the complexity of the shortest path models for col- umn generation in VRPTW [ J ] . Operations Research , 1994,42 (5) : 977- 978.
6Paradis J.Coevolutionary Computation[J].A Artificial Life, 1995
7Fang-chang lin,Jane yung-jen hsu. Cooperation Protocols in MultiAgent Robotic Systems[J].Autonomous Robots, 1997; (4): 175～ 198
8Mitchell A Potter. A cooperative coevolutionary approach to function optimization. Parallel problem solving from nature, Jerusalem, Israel,SpringerVerlag, 1994: 249～257
9Bugajska,Magdalena D,Alan C Sehultz. Co-Evolution of Form and Function in the Design of Autonomous Agents:Micro Air Vehicle Project[C].In:GECCO-2000 Workshop on Evolution of Sensors in Nature,Hardware,and Simulation,Las Vegas,NV,2000
10Hillis D.Co-evolving parasites improves simulated evolution as an optimization procedure[C].In:C Langton,C Taylor,Rasmussen S eds.Artificial Life Ⅱ,Addison-Wesley,Reading,MA

共引文献14

1姚宗信,李明,陈宗基.基于博弈论模型的多机协同对抗多目标任务决策方法[J].航空计算技术,2007,37(3):7-11. 被引量：24
2姚宗信,李明,陈宗基.多机协同作战任务决策方法多智能体结构框架[J].电光与控制,2008,15(3):1-4. 被引量：26
3耿盛涛,刘国栋.一种稳健的足球机器人目标识别算法[J].计算机系统应用,2010,19(12):54-58.
4柯文德,朴松昊,彭志平,蔡则苏,苑全德.基于π演算的足球机器人协作Q学习方法[J].计算机应用,2011,31(3):654-656. 被引量：4
5王腾,李长江.基于强化学习的全自主机器人足球系统协作研究[J].科学技术与工程,2011,11(5):979-982. 被引量：1
6么立双,苏丽颖,李小鹏.多机器人系统任务分配方式的研究与发展[J].制造业自动化,2013,35(10):21-24. 被引量：5
7柯文德,洪炳镕,崔刚,蔡则苏.一种基于π-MaxQ学习的多机器人协作方法[J].智能计算机与应用,2013,3(3):14-17. 被引量：2
8曹洁,朱宁宁.动态环境中的多机器人协同搬运[J].计算机工程与应用,2013,49(23):252-256. 被引量：1
9殷凡,牛丽.基于进化算法优化的多Agent系统协作模型[J].科技通报,2015,31(11):207-210.
10宋文静,李为民,肖金科,刘永兰.基于MAS的区域反导发射车协同拦截规划研究[J].现代防御技术,2015,43(6):81-86. 被引量：1

同被引文献25

1汪士果,张俊民.基于数据挖掘的会计舞弊识别问题研究综述[J].中南财经政法大学学报,2011(1):79-84. 被引量：7
2徐士琴,刘国山.政府奖励与惩罚机制下闭环供应链网络均衡的互补模型[J].数学的实践与认识,2012,24(16):87-102. 被引量：7
3刘全平,梁加红,李猛,付跃文.基于多智能体和元胞自动机人群疏散行为研究[J].计算机仿真,2014,31(1):328-332. 被引量：17
4张新培,赵文华.研究型大学与高水平智库协同发展及启示[J].中国高教研究,2014(8):6-10. 被引量：10
5雷振华,邹果.内部控制视角下高校财务风险预警指标体系的构建[J].财务与会计,2014(10):57-58. 被引量：50
6赵红卫.高等学校内部控制的基本范畴与框架建构[J].审计研究,2015(3):108-112. 被引量：68
7王文.中国应培育浓厚的智库文化——兼谈对智库学者的激励机制[J].对外传播,2015(9):43-44. 被引量：4
8吴育良.国外智库决策信息支持研究及启示[J].图书馆理论与实践,2015(10):31-35. 被引量：17
9卓灵,聂静,肖静薇,袁杨,胡新,陈柯.电力无线通信异构多网共存环境中的网络选择算法[J].计算机工程与科学,2016,38(1):78-83. 被引量：5
10孙支南,王超辉.论高校内部控制与风险管理[J].高教探索,2016(1):16-19. 被引量：31

引证文献3

1陈海贝,卓翔芝.动态惩罚机制下智库行为及其监管策略的演化博弈分析[J].淮北师范大学学报（自然科学版）,2019,40(2):60-68. 被引量：2
2蒋欣然.控制论四要素视角下的高校内部控制问题分析与对策[J].商业会计,2020,0(5):26-31. 被引量：3
3聂雷,刘博,李鹏,何亨.基于多智能体Q学习的异构车载网络选择方法[J].计算机工程与科学,2021,43(5):836-844. 被引量：3

二级引证文献8

1李秀芹.关于完善高校内部控制制度的策略探讨[J].中小企业管理与科技,2020(5):128-129. 被引量：6
2张颖萍,张琳梓.高校内部控制风险与对策研究[J].商业会计,2021(9):57-60. 被引量：4
3黄晋鸿,曲海燕.新时代中国特色新型智库的行为评价研究——基于2016-2019年全国31家省级社会科学院的调查数据[J].情报理论与实践,2021,44(7):44-49. 被引量：2
4陆建荣,石怀峰.基于车载异构网络的数据聚合终端设计[J].无线电工程,2022,52(4):664-670.
5韦冬妮,齐彩娟,张泽龙,唐梦媛.基于深度数据挖掘和区块链技术的智库数据管控方法研究[J].电子设计工程,2022,30(13):114-118. 被引量：2
6聂雷,朱婵娟,陈美君.基于自适应切换阈值的异构车载网络选择方法[J].计算机与数字工程,2022,50(6):1306-1311.
7王朋雨,米根锁,王彦快.基于HQL(λ)的城市轨道交通车地通信资源分配研究[J].铁道标准设计,2023,67(1):175-181.
8杨杰.公办高校内部控制建设存在的问题及对策研究[J].会计师,2023(9):79-81. 被引量：1

1Jeanine Katzel,辛磊夫.建立自动化与IT的协作团队[J].软件,2008(12):18-22.
2Wade Foster.如何打造优秀的远程团队[J].程序员,2014,0(11):8-9.
3王长缨,陈文伟,姚莉.一种基于团队马尔可夫博弈的多agent协同强化学习算法[J].复旦学报（自然科学版）,2004,43(5):842-844. 被引量：2
4王长缨,陈文伟.多agent协同强化学习算法SE-MACOL及其应用[J].广西师范大学学报（自然科学版）,2006,24(4):167-170. 被引量：5
5王长缨,尹晓虎,鲍翊平,姚莉.基于随机博弈的Agent协同强化学习方法[J].计算机工程与科学,2006,28(2):107-110. 被引量：4
6李良章.以网络课例为平台提高教师课堂教学水平[J].教育信息技术,2009(11):37-38.
7王长缨,尹晓虎,鲍翊平,姚莉.一种共享经验元组的多agent协同强化学习算法[J].模式识别与人工智能,2005,18(2):234-239. 被引量：4
8李国阳,刘志明,韦巍.基于手势跟踪的人-机器人协作研究[J].制造业自动化,2008,30(4):50-53. 被引量：2
9DC—DC转换器技术的突破[J].经济导报（汽车工业）,2009(4):8-9.
10陶雪娇,曾德生.浅析基于WEB的协作学习过程评价方法[J].大众商务,2010(16):215-215.

计算机工程与科学

2015年第9期

浏览历史

内容加载中请稍等...

基于演化博弈惩罚机制的多智能体协作稳定性研究被引量：3

参考文献4

二级参考文献29

共引文献14

同被引文献25

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于演化博弈惩罚机制的多智能体协作稳定性研究 被引量：3

参考文献4

二级参考文献29

共引文献14

同被引文献25

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于演化博弈惩罚机制的多智能体协作稳定性研究被引量：3