AODE中的多agent协商与学习被引量：4

MULTI-AGENT NEGOTIATION AND LEARNING IN AODE

导出

摘要 AODE是我们研制的一个面向agent的智能系统开发环境,本文以AOD为平台研究了多agent环境下的协商与学习,本文利用协商-协商过程-协商线程的概念建立了多边-多问题协商模型MMN,该协商模型支持多agent环境中的多种协商形式及agent在协商过程中的学习,系统中的学习agent采用状态概率聚类空间上的多agent强化学习算法,该算法通过使用状态聚类方法减少Q值表存储所需空间,降低了经典Q-学习算法由于使用Q值表导致的对系统计算资源的要求,且该算法仍然可以保证收敛到最优解。 Negotiation and learning in multi-agent environment in AODE, which is an agent oriented development environment for intelligent software system, is studied. A negotiation model called MMN is provided based on the concept of negotiation - negotiation process - negotiation thread. This model supports many types of negotiation and learning during the negotiation process. Reinforcement learning with soft state aggregation is adopted in AODE. As a result, the Q-learning algorithm used in AODE needs less storage space for Q-value than the standard Q-learning which uses the Q-value look-up table. And the Q-learning algorithm used in AODE is guaranteed to converge to its optimal solution under specified conditions.

作者王立春李红兵陈世福

机构地区南京大学计算机软件新技术国家重点实验室

出处《模式识别与人工智能》 EI CSCD 北大核心 2001年第3期347-351,共5页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金高等学校博士点基金

关键词多AGENT系统协商 AODE 智能系统开发环境学习算法人工智能 Multi-Agent System, Negotiation, Reinforcement Learning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1骆斌,王立春,谢俊元,陈世福.AODE中Agent通信机制的设计与实现[J].模式识别与人工智能,2000,13(1):94-98. 被引量：3
2Hu J，Proceedings of the 15th International Conference on Machine Leaming，1998年，242页
3Sen S，Adaption and Learning in Multi-Agent Systems，1995年，1042卷，218页

二级参考文献3

1孙涛,丁琴琴,李卫兵,李娟.ADAS系统测试平台设计及实现[J].中国测试,2019,45(4):151-156. 被引量：9
2孙扬,付智超,熊光明.无人驾驶车辆虚拟测试技术的发展[J].科技导报,2019,37(15):106-113. 被引量：6
3谢辉.车路协同环境下的车辆跟驰行为研究[J].公路,2019,0(8):317-320. 被引量：8

共引文献2

1郭磊,张东摩,李斌.框架问题的一种可行解[J].模式识别与人工智能,2000,13(2):121-127. 被引量：2
2赵斌,毕贵红,杨肖鸳.应用于虚拟企业信息平台智能主体的构建[J].系统工程理论与实践,2003,23(6):56-62. 被引量：2

同被引文献89

1庄晓东,孟庆春,魏天滨,王旭柱,谭锐,李筱菁.Robot path planning in dynamic environment based on reinforcement learning[J].Journal of Harbin Institute of Technology(New Series),2001,8(3):253-255. 被引量：3
2杨明,嘉莉,邱玉辉.基于增强学习的多agent自动协商研究[J].计算机工程与应用,2004,40(33):98-100. 被引量：6
3杨佩,高阳,陈兆乾.一种劝说式多Agent多议题协商方法[J].计算机研究与发展,2006,43(7):1149-1154. 被引量：21
4张宏,何华灿.多Agent自动协商策略和算法[J].计算机应用,2006,26(8):1935-1937. 被引量：13
5SHUAI JW, CHEN Z X, LIU R T. Self-evolution neural model [J]. Physics Letters A, 1996, 221(5):311-316.
6POTA POVE A, KALIM. Robust chaos in neural networks[J]. Physics Letters A, 2000,277(6):310-322.
7ZHANG J, WALTER G G, MIAOYB. Wavelet neural networks for function learning[J]. IEEE Transactions on Signal Processing 1995, 43(6):1485-1497.
8吴应良,电子商务原理及应用[M].华南理工大学出版社,2002.3.
9Wooldridge, M. (1995) This is MYWORLD: the logic if an agent-oriented testbed for DAI[D]. In Intelligent Agents: Theories, Architectures and Languages(eds M. Wooldridge and N.R. Jennings), LNAI Volume 890, pp. 160-178. Springer, Berlin.
10Michael Wooldridge. An Introduction to Multi-Agent System [M].

引证文献4

1宋梅萍,顾国昌,张国印.随机博弈框架下的多agent强化学习方法综述[J].控制与决策,2005,20(10):1081-1090. 被引量：12
2朱少林,赵怡.B2B的EB自动协商的影响因素[J].中国电子商务,2011(10):22-23.
3张淑军,孟庆春,宋长虹,张艳,张文.多智能体系统混合智能学习算法研究[J].哈尔滨工业大学学报,2003,35(9):1083-1085. 被引量：5
4张淑军,孟庆春,宋长虹,李占斌,张文.基于多Agent的混合智能学习算法及在足球机器人中的应用[J].机器人,2003,25(6):526-530. 被引量：3

二级引证文献19

1郭晓军,杨建军,李红卫.Agent仿真中具有先验知识的混合学习算法与混合结构模型[J].海军航空工程学院学报,2007,22(2):247-251.
2杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
3蔡自兴,邹小兵,王璐,段琢华,于金霞.移动机器人分布式控制系统的设计[J].中南大学学报（自然科学版）,2005,36(5):727-732. 被引量：11
4何涛,白振兴.多智能体系统设计的关键技术研究[J].现代电子技术,2006,29(14):31-34. 被引量：2
5宋清昆,胡子婴.基于经验知识的Q-学习算法[J].自动化技术与应用,2006,25(11):10-12. 被引量：7
6严耀华,程显毅.RoboCup中整体与局部混合防御模型的研究[J].现代电子技术,2007,30(4):52-54. 被引量：1
7JIANG Jian-Guo,SU Zhao-Pin,QI Mei-Bin,ZHANG Guo-Fu.Multi-task Coalition Parallel Formation Strategy Based on Reinforcement Learning[J].自动化学报,2008,34(3):349-352. 被引量：6
8赵晓华,李振龙,于泉,李云驰.基于NashCC-Q学习的两交叉口信号灯协调控制[J].系统仿真学报,2008,20(17):4660-4663. 被引量：2
9战忠丽,王强,王佩霞.多Agent系统中Q学习算法研究[J].辽宁农业职业技术学院学报,2008,10(5):48-50.
10刘建美,马寿峰.基于有限理性的个体出行路径选择进化博弈[J].控制与决策,2009,24(10):1450-1454. 被引量：10

1王治和,尉梅,尹旭日.智能系统开发环境中agent的一种协商机制[J].西北师范大学学报（自然科学版）,1999,35(1):27-31.
2骆斌,王立春,谢俊元,陈世福.AODE中Agent通信机制的设计与实现[J].模式识别与人工智能,2000,13(1):94-98. 被引量：3
3王立春,高阳,陈世福.AODE中基于强化学习的Agent协商模型[J].南京大学学报（自然科学版）,2001,37(2):135-141. 被引量：14
4刘文娟.基于贝叶斯理论的分类算法研究[J].计算机光盘软件与应用,2014,17(16):109-110. 被引量：2
5王立春,陈世福.多Agent多问题协商模型[J].软件学报,2002,13(8):1637-1643. 被引量：58
6李宁,高阳,陆鑫,陈世福.一种基于强化学习的学习Agent[J].计算机研究与发展,2001,38(9):1051-1056. 被引量：26
7张东摩,陈世福.AODE中智能体心智状态的表示与处理[J].软件学报,1997,8(A00):357-364. 被引量：2
8郑淑丽,韩江洪,骆祥峰,蒋建文.多Agent系统的协作及强化学习算法研究[J].模式识别与人工智能,2002,15(4):453-457. 被引量：2
9李红兵,艾早阳,陈世福.一个基于Java的Agent应用开发环境框架[J].小型微型计算机系统,2000,21(1):35-39. 被引量：17
10孙志伟,赵政.DBSCAN在非空间属性处理上的扩展[J].计算机应用,2005,25(6):1379-1381. 被引量：4

模式识别与人工智能

2001年第3期

浏览历史

内容加载中请稍等...

AODE中的多agent协商与学习被引量：4

参考文献3

二级参考文献3

共引文献2

同被引文献89

引证文献4

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

AODE中的多agent协商与学习 被引量：4

参考文献3

二级参考文献3

共引文献2

同被引文献89

引证文献4

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

AODE中的多agent协商与学习被引量：4