检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

A MULTI-AGENT LOCAL-LEARNING ALGORITHM UNDER GROUP ENVIROMENT: 1; 作者 Jiang Daoping Yin Yixin Ban Xiaojuan Meng Xiangsong 《Journal of Electronics(China)》 2009年第2期229-236,共8页; In this paper,a local-learning algorithm for multi-agent is presented based on the fact that individual agent performs local perception and local interaction under group environment.As for in-dividual-learning,agent a... 展开更多; 关键词 q学习算法多agent 环境计算复杂度代理人贪婪策略相互作用; 下载PDF 职称材料

基于改进多智能体Nash Q Learning的交通信号协调控制: 2; 作者苏港叶宝林 +2 位作者姚青陈滨张一嘉《软件工程》 2024年第10期43-49,共7页; 为了优化区域交通信号配时方案,提升区域通行效率,文章提出一种基于改进多智能体Nash Q Learning的区域交通信号协调控制方法。首先,采用离散化编码方法,通过划分单元格将连续状态信息转化为离散形式。其次,在算法中融入长短时记忆网络(... 展开更多; 关键词区域交通信号协调控制马尔科夫决策多智能体nash q learning LSTM SUMO; 下载PDF 职称材料

一般和博弈中的合作多agent学习被引量：7: 3; 作者宋梅萍顾国昌 +1 位作者张国印刘海波《控制理论与应用》 EI CAS CSCD 北大核心 2007年第2期317-321,共5页; 理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的... 展开更多; 关键词多agent学习一般和随机博弈 nash平衡 PARETO占优 q-学习; 下载PDF 职称材料

多智能体Q学习在多AUV协调中的应用研究被引量：4: 4; 作者严浙平李锋黄宇峰《应用科技》 CAS 2008年第1期57-60,共4页; 分析了近年来提出的几种主要单、多智能体强化算法,提出一种多智能体Q学习算法,并将它用于多AUV协调中.此算法融合了Nash-Q、CE-Q及WoLF-PHC的算法思想或表达形式,程序简单、容易计算,并且具有很好的收敛性.多AUV协调控制仿真实验结果... 展开更多; 关键词多智能体 q学习 nash均衡多AUV; 下载PDF 职称材料

群体环境下基于随机对策的多Agent局部学习算法: 5; 作者尹怡欣江道平 +1 位作者班晓娟孟祥嵩《信息与控制》 CSCD 北大核心 2008年第6期703-708,共6页; 基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法.算法在与局部环境交互中采用贪婪策略最大化自身利益.分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法;提出了... 展开更多; 关键词多agent学习随机对策 nash—q 局部学习; 下载PDF 职称材料

多智能体环境下的情绪决策模型被引量：2: 6; 作者林君焕刘箴陈月芬《模式识别与人工智能》 EI CSCD 北大核心 2015年第4期369-376,共8页; 建立一种基于情绪的Nash-Q决策模型,它由认知层和情绪层组成.认知层模型由Nash-Q算法实现,情绪层建立在情绪记忆和评价理论之上,由高兴、伤心、恐惧、厌烦组成情绪空间,建立相应刺激与情绪映射模型、情绪与行为动作映射模型、每种情绪... 展开更多; 关键词多智能体决策 nash-q学习情绪决策博弈理论; 下载PDF 职称材料

基于参数逼近的多智能体强化学习算法被引量：2: 7; 作者赵高长刘豪苏军《计算机工程与设计》北大核心 2020年第3期862-866,共5页; 为改善多智能体纳什Q学习算法适应性差、条件苛刻、运算复杂,且没有通用方法更新策略价值等问题,提出基于参数的算法改进思路。引入联合动作向量简化算法,引入参数,通过参数近似控制状态-行为值函数,转化训练目标,给出参数逼近的值函数... 展开更多; 关键词智能体系统强化学习马尔科夫博弈 q学习纳什均衡; 下载PDF 职称材料

基于一般和随机对策论框架下的多智能体学习被引量：1: 8; 作者欧海涛张卫东许晓鸣《自动化学报》 EI CSCD 北大核心 2002年第3期423-426,共4页; 将 Q- learning从单智能体框架上扩展到非合作的多智能体框架上 ,建立了在一般和随机对策框架下的多智能体理论框架和学习算法 ,提出了以 Nash平衡点作为学习目标 .给出了对策结构的约束条件 ,并证明了在此约束条件下算法的收敛性。; 关键词随机对策论多智能体学习学习算法强化学习; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	A MULTI-AGENT LOCAL-LEARNING ALGORITHM UNDER GROUP ENVIROMENT	Jiang Daoping Yin Yixin Ban Xiaojuan Meng Xiangsong	《Journal of Electronics(China)》	2009	0	下载PDF 职称材料
2	基于改进多智能体Nash Q Learning的交通信号协调控制	苏港叶宝林姚青陈滨张一嘉	《软件工程》	2024		下载PDF 职称材料
3	一般和博弈中的合作多agent学习	宋梅萍顾国昌张国印刘海波	《控制理论与应用》 EI CAS CSCD 北大核心	2007	7	下载PDF 职称材料
4	多智能体Q学习在多AUV协调中的应用研究	严浙平李锋黄宇峰	《应用科技》 CAS	2008	4	下载PDF 职称材料
5	群体环境下基于随机对策的多Agent局部学习算法	尹怡欣江道平班晓娟孟祥嵩	《信息与控制》 CSCD 北大核心	2008	0	下载PDF 职称材料
6	多智能体环境下的情绪决策模型	林君焕刘箴陈月芬	《模式识别与人工智能》 EI CSCD 北大核心	2015	2	下载PDF 职称材料
7	基于参数逼近的多智能体强化学习算法	赵高长刘豪苏军	《计算机工程与设计》北大核心	2020	2	下载PDF 职称材料
8	基于一般和随机对策论框架下的多智能体学习	欧海涛张卫东许晓鸣	《自动化学报》 EI CSCD 北大核心	2002	1	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部