多智能体机器人系统分散式通信决策研究被引量：5

Research on Decentralized Communication Decision in the Multi-Agent Robotic System

下载PDF

导出

摘要为了减少多智能体机器人系统协调所需通信的数量,提出了一种新的方法.利用有向无环图表示团队的可能联合信度,并基于此以分散式的方式制定通信决策,仅当智能体自身的观察信息显示共享信息将导致期望回报升高时才选择通信.通过维持以及推理团队的可能联合信度将集中式单智能体策略应用于分散式多智能体POM-DP问题.通过实验以及一个详细的实例表明,本文方法能够有效地减少通信资源的使用,同时提高分散执行的性能. In order to reduce communication amount in the coordination of multi-agent robotic system, this paper presents a novel approach to make communication decisions in a decentralized fashion. The possible joint beliefs of the team are represented based on a directed acyclic graph and communication is chosen only when an agent＇s local observations indicate that the shared ＇information will lead to an increase in expected reward. The centralized single-agent policies are applied to decentralized multi-agent POMDPs by maintaining and reasoning over the possible joint beliefs of the team. Experiment and a detailed example show that the presented approach can reduce communication amount and improve the distributed execution performance.

作者刘海涛洪炳镕乔立民朴松昊

机构地区哈尔滨工业大学计算机科学与技术学院

出处《机器人》 EI CSCD 北大核心 2007年第6期540-545,共6页 Robot

基金国家863计划资助项目(2006AA04Z259)

关键词通信多智能体系统分散式控制分散式POMDP communication multi-agent system decentralized control decentralized POMDP

分类号 TP24 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献8

1Xuan P,Lesser V.Multi-agent policies:From centralized ones to decentralized ones[A].Proceedings of the International Joint Conference on Autonomous Agents and Multiagent Systems[C].New York,NY,USA:ACM,2002.1098 -1105.
2Goldman C V,Zilberstein S.Decentralized control of cooperative systems:Categorization and complexity analysis[J].Journal of Artificial Intelligence Research,2004,22:143-174.
3Hansen E A,Bernstein D S,Zilberstein S.Dynamic programming for partially observable stochastic games[A].Proceedings of the Nineteenth National Conference on Artificial Intelligence[C].Menlo Park,CA,USA:AAAI,2004.709 -715.
4Peshkin L,Kim K E,Meuleau N,et al.Learning to cooperate via policy search[A].Proceedings of the Sixteenth Conference on Uncertainty in Artificial Intelligence[C].USA:Morgan Kaufmann,2000.489-496.
5Pynadath D V,Tambe M.The communicative multiagent team decision problem:Analyzing teamwork theories and models[J].Journal of Artificial Intelligence Research,2002,16:389 -423.
6Nair R,Tambe M,Roth M,et al.Communication for improving policy computation in distributed POMDPs[A].Proceedings of the International Joint Conference on Autonomous Agents and Multiagent Systems[C].New York,NY,USA:ACM,2004.1098-1105.
7Roth M,Simmons R,Veloso M.Decentralized communication strategies for coordinated multi-agent policies[A].Multi-Robot Systems:From Swarms to Intelligent Automata Vol.Ⅲ[C].Dordrecht,Netherlands:Springer,2005.93 -106.
8Littman M L,Cassandra A,Kaelbling L.Learning policies for partially observable environments:Scaling up[A].Proceedings of the 12th International Conference on Machine Learning[C].San Francisco,CA:Morgan Kaufmann Publishers,1995.362 -370.

同被引文献45

1靳洋,张毅.基于无线Ad Hoc网络的多移动机器人系统[J].重庆邮电大学学报（自然科学版）,2006,18(z1):142-144. 被引量：6
2钟伟才,刘静,刘芳焦,李成.组合优化多智能体进化算法[J].计算机学报,2004,27(10):1341-1353. 被引量：34
3范波,潘泉,张洪才.基于Markov对策的多智能体协调方法及其在Robot Soccer中的应用[J].机器人,2005,27(1):46-51. 被引量：5
4熊举峰,谭冠政,盘辉.多机器人系统的研究现状[J].计算机工程与应用,2005,41(30):28-30. 被引量：11
5吴艮霞,李国阳,韦巍.基于WLAN的多机器人分布式合作系统研究[J].机电工程,2006,23(5):32-36. 被引量：5
6蔡京平,贾云得.一种用于星球探测机器人的计算系统体系结构[J].小型微型计算机系统,2006,27(6):1102-1107. 被引量：1
7李莹莹,刘云辉,樊玮虹,蔡宣平,李波.基于移动通信网络的机器人遥操作[J].通信学报,2006,27(5):52-59. 被引量：9
8杨毅,武传坤.无线自组网路由的树型层次安全模型(英文)[J].中国科学院研究生院学报,2007,24(1):99-105. 被引量：2
9张秋花,薛惠锋,吴介军,寇晓东.多智能体系统MAS及其应用[J].计算机仿真,2007,24(6):133-137. 被引量：24
10GB16806-2006,消防联动控制系统.

引证文献5

1蔡自兴,任孝平,邹磊,匡林爱.一种簇结构下的多移动机器人通信方法[J].小型微型计算机系统,2010,31(3):553-556. 被引量：1
2郑延斌,郭凌云,刘晶晶.多智能体系统分散式通信决策研究[J].计算机应用,2012,32(10):2875-2878. 被引量：3
3赵鹤云,孙瀛.分散智能型火灾报警控制系统的技术实现[J].电子世界,2014(18):41-42.
4潘颖慧,曾一锋.交互式动态影响图研究及其最优K模型解法[J].计算机学报,2018,41(1):28-46. 被引量：3
5安敬民,李冠宇,张冬青,蒋伟.面向序贯决策中异常情景下交互问题处理方法[J].计算机集成制造系统,2020,26(12):3274-3282.

二级引证文献7

1任孝平,蔡自兴,邹磊,匡林爱.“中南移动二号”多移动机器人通信系统[J].中南大学学报（自然科学版）,2010,41(4):1442-1448.
2胡晓辉,王振强,陈永.车-地通信场景的一种混合建模方法研究[J].计算机工程与应用,2015,51(16):228-233.
3戴剑勇,邹树梁,汪敏.放射性污染物多智能体系统免疫克隆选择优化[J].南华大学学报（社会科学版）,2016,17(3):10-14.
4安敬民,李冠宇,张冬青,蒋伟.面向序贯决策中异常情景下交互问题处理方法[J].计算机集成制造系统,2020,26(12):3274-3282.
5宋伟中,王行业,王宁.一种面向无人机区域协同覆盖的感知任务分配方法[J].计算机应用与软件,2021,38(5):75-81. 被引量：3
6段昶,陈亮,耿俊香.一种集群通信的多智能体强化学习算法[J].沈阳理工大学学报,2021,40(4):11-17.
7李壮阔,常凯旋.合作博弈的连续蚁群算法求解[J].计算机工程与应用,2021,57(24):198-204. 被引量：2

1赵晓怡,杨明福,黄桂敏.基于蚁群算法的对等网模拟器的设计与实现[J].计算机应用与软件,2005,22(1):85-87. 被引量：3
2Fouad Moutaouakkil Hicham Medromi.Developing Multi-Agent System Robotics[J].材料科学与工程（中英文B版）,2012,2(6):414-420.
3Helmut Klemm.智能化液压控制[J].现代制造,2015,0(7):25-25.
4张文志,李智军,吕恬生,罗青.自适应模糊RBF神经网络的多智能体机器人强化学习[J].计算机工程与应用,2003,39(32):111-115. 被引量：3
5薄喜柱,洪炳熔.多智能体机器人系统的合作编队行为研究[J].宇航学报,2001,22(3):38-44. 被引量：12
6吴建兵,杨杰,吴月华,刘际明,何多慧.一个进化的多智能体机器人系统[J].中国科学技术大学学报,1998,28(5):591-597. 被引量：4
7薛宏涛,沈林成,常文森.方兴未艾的多智能体机器人技术[J].机器人技术与应用,1999(6):2-3. 被引量：1
8王维新.现场总线技术的特点及应用[J].西安文理学院学报（自然科学版）,2007,10(4):61-65. 被引量：3
9王易.现场总线技术的特点和应用[J].通信电源技术,2001,18(2):34-36. 被引量：1
10孙丽丽,吴铁军.严格反馈互联系统分散式backstepping自适应迭代学习控制[J].控制理论与应用,2014,31(11):1530-1538. 被引量：1

机器人

2007年第6期

浏览历史

内容加载中请稍等...

多智能体机器人系统分散式通信决策研究被引量：5

参考文献8

同被引文献45

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多智能体机器人系统分散式通信决策研究 被引量：5

参考文献8

同被引文献45

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多智能体机器人系统分散式通信决策研究被引量：5