期刊文献+
共找到327篇文章
< 1 2 17 >
每页显示 20 50 100
基于双视角建模的多智能体协作强化学习方法
1
作者 刘全 施眉龙 +1 位作者 黄志刚 张立华 《计算机学报》 EI CAS CSCD 北大核心 2024年第7期1582-1594,共13页
在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建... 在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建模的多智能体协作强化学习方法(Bi-ViewModelingCollaborative Multi-Agent Reinforcement Learning,简称BVM-CMARL).该方法从局部和全局两个视角对智能体进行建模,分别用于产生多样性的策略和激励协作.在局部视角最大化局部变分与自身轨迹的互信息,激励智能体的策略多样性;同时在全局视角最大化全局变分与其他智能体动作的互信息,提高智能体协作水平.最后将局部变分训练出的局部Q值与全局变分训练出的全局Q值合并,避免低效协作.将BVM-CMARL算法应用于星际争霸多智能体挑战赛(StarCraft Multi-AgentChallenge,SMAC)中的等级觅食(Level-BasedForaging,LBF)和走廊(Hallway)等环境,与QMIX、QPLEX、RODE、EOI和MAVEN等5种目前优秀的强化学习算法相比,BVM-CMARL算法具有更好的稳定性和性能表现,在SMAC上的平均胜率为82.81%,比次优算法RODE高13.42%.通过设计模型变体,在消融实验中证明了双视角建模对BVM-CMARL的必要性. 展开更多
关键词 深度强化学习 多智能体系统 多智能体协 协作建模 对比学习
下载PDF
基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法
2
作者 王宪伟 冯翔 虞慧群 《计算机科学》 CSCD 北大核心 2024年第7期319-326,共8页
动态障碍物一直是阻碍智能体自主导航发展的关键因素,而躲避障碍物和清理障碍物是两种解决动态障碍物问题的有效方法。近年来,多智能体躲避动态障碍物(避障)问题受到了广大学者的关注,优秀的多智能体避障算法纷纷涌现。然而,多智能体清... 动态障碍物一直是阻碍智能体自主导航发展的关键因素,而躲避障碍物和清理障碍物是两种解决动态障碍物问题的有效方法。近年来,多智能体躲避动态障碍物(避障)问题受到了广大学者的关注,优秀的多智能体避障算法纷纷涌现。然而,多智能体清理动态障碍物(清障)问题却无人问津,相对应的多智能体清障算法更是屈指可数。为解决多智能体清障问题,文中提出了一种基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法(Multi-Agent Cooperative Algorithm for Obstacle Clearance Based on Deep Deterministic Policy Gradient and Attention Critic, MACOC)。首先,创建了首个多智能体协同清障的环境模型,定义了多智能体及动态障碍物的运动学模型,并根据智能体和动态障碍物数量的不同,构建了4种仿真实验环境;其次,将多智能体协同清障过程定义为马尔可夫决策过程(Markov Decision Process, MDP),构建了多智能体t的状态空间、动作空间和奖励函数;最后,提出一种基于深度确定性策略梯度与注意力Critic的多智能体协同清障算法,并在多智能体协同清障仿真环境中与经典的多智能体强化学习算法进行对比。实验证明,相比对比算法,所提出的MACOC算法清障的成功率更高、速度更快,对复杂环境的适应性更好。 展开更多
关键词 强化学习算法 马尔可夫决策过程 多智能体协同控制 动态障碍物清除 注意力机制
下载PDF
概率驱动的动态多目标多智能体协同调度进化优化
3
作者 刘晓芳 张军 《计算机应用》 CSCD 北大核心 2024年第5期1372-1377,共6页
在多智能体系统中,协作任务往往动态变化,且存在多个冲突的优化目标,因此动态多目标多智能体协同调度问题已经成为亟须解决的关键问题之一。针对动态环境下多智能体协同调度需求,提出了概率驱动的动态预测策略,旨在有效利用历史环境概... 在多智能体系统中,协作任务往往动态变化,且存在多个冲突的优化目标,因此动态多目标多智能体协同调度问题已经成为亟须解决的关键问题之一。针对动态环境下多智能体协同调度需求,提出了概率驱动的动态预测策略,旨在有效利用历史环境概率分布,预测决策解在新环境的概率分布,从而生成新的多智能体调度方案,实现调度算法在动态环境下的快速响应。具体来讲,设计了基于元素的概率分布表达,以表示解的构成元素在动态环境的适应性,并根据优化算法迭代最优解逐步更新概率分布以趋近实际分布;构建了基于融合的概率分布预测机制,考虑到环境变化的连续性和相关性,当环境变化时,通过融合历史概率分布预测新环境的概率分布,为新环境优化提供先验知识;提出了基于启发式的新解采样机制,结合概率分布和启发式信息,生成解方案以更新过时种群。将概率驱动的动态预测策略嵌入新型的多目标进化算法,获得概率驱动的动态多目标进化算法。在10个动态多目标多智能体协同调度问题实例上,实验结果表明,所提算法在解最优性和多样性上显著优于已有多目标进化算法,所提的概率驱动的动态预测策略能够提高多目标进化算法对动态环境的适应能力。 展开更多
关键词 动态多目标优化 粒子群优化 进化计算 多智能体协同调度 概率驱动
下载PDF
基于多目位姿实时监测的多体协同技术研究
4
作者 周玲 王安琪 +1 位作者 吴林鹏 张丽艳 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2023年第S02期77-84,共8页
多目位姿实时监测系统是一种高精度的数字化测量设备,可用于获取目标物在空间中三维位置信息。本文将多个麦克纳姆移动机器人和多目视觉系统相结合构建智能体集群系统,该系统由定位子系统、通信子系统、控制子系统3部分组成。多目视觉... 多目位姿实时监测系统是一种高精度的数字化测量设备,可用于获取目标物在空间中三维位置信息。本文将多个麦克纳姆移动机器人和多目视觉系统相结合构建智能体集群系统,该系统由定位子系统、通信子系统、控制子系统3部分组成。多目视觉系统作为定位系统通过反光靶球对智能体进行定位,通信子系统将定位信息实时输入控制子系统,控制子系统识别不同的智能体,并将相机坐标系下位姿关系转换到世界坐标系下,再根据不同智能体彼此间的位置关系,设计相应的协同控制算法解算单个智能体所需的姿态控制输入,控制智能体达到指定的位置。测试结果表明,用多目位姿实时监测系统辅助多智能体定位,定位误差小,可令整个智能体集群拥有良好的协同控制性能。 展开更多
关键词 多目位姿实时监测系统 多智能体协同控制 动态轨迹跟踪
下载PDF
科体协同创新:国际范例、理论框架与中国进路 被引量:3
5
作者 孙民康 孙有平 《中国体育科技》 北大核心 2023年第2期3-9,共7页
为厘清科体协同创新的理论基础和实践模式,助力科体协同创新实施,探讨了科体协同创新的国际范例和理论框架,并结合中国特色社会主义新时代特点探索科体协同创新的实践进路。研究认为,现有科体协同创新范例呈现出创新活动参与方数量、类... 为厘清科体协同创新的理论基础和实践模式,助力科体协同创新实施,探讨了科体协同创新的国际范例和理论框架,并结合中国特色社会主义新时代特点探索科体协同创新的实践进路。研究认为,现有科体协同创新范例呈现出创新活动参与方数量、类型增多;创新实践领域趋于多元化,跨界合作成为新常态;运行平台“虚拟化”的发展趋势。从知识整合(主要包括知识、资源、行动、绩效)和互动(主要包括科体知识分享、资源优化配置、行动最优同步、系统高度匹配)两个维度构建实现沟通-协调-合作-协同的科体协同创新理论框架。现阶段,我国科体协同创新基础理论和实践亟需探讨政府相关部门在科体协同创新中的角色定位及政府行为对科体协同创新与其社会效益的影响、科体协同创新政策的制定、执行和评估、第三方机构对科体协同创新的影响、创新要素间低信任度对科体协同创新的影响和科体协同创新成果转化5项发展议题。基于中国特色社会主义新时代特点和国外科体协同创新运作经验,提出聚焦国家战略需求明确创新战略目标、搭建灵活多样的协同创新平台、促进创新成果转化、引入科学的激励机制及完善绩效评价体系5点推进建议。 展开更多
关键词 体协同创新 国际范例 理论框架 科技助力 中国实践进路
下载PDF
迈向体育科技强国:科体协同创新的范式演进、内涵解析与实践路向
6
作者 孙民康 王辉 孙有平 《河北体育学院学报》 2023年第5期1-9,38,共10页
为加快体育科技强国建设,助力体育科研成果转化,我国提出了“科体协同”创新工作机制和合作协议。探讨科体协同创新范式的演进过程、解析科体协同创新理论的基本内涵,并在梳理我国科体协同创新实践基础上,结合我国国情和新时代特点提出... 为加快体育科技强国建设,助力体育科研成果转化,我国提出了“科体协同”创新工作机制和合作协议。探讨科体协同创新范式的演进过程、解析科体协同创新理论的基本内涵,并在梳理我国科体协同创新实践基础上,结合我国国情和新时代特点提出我国科体协同创新未来路向。认为,科体协同创新范式发展经历了协同制造和开放式创新、跨界协作、多边融合三个阶段。战略、知识、组织三位互动构成了科体协同创新的基本内涵。搭建科体协同创新平台是组织运行的结构基础,可从三方面进行宏观布局:战略协同层面,面向新的体育需求,坚持“人民至上”理念和“需求”导向;知识协同层面,面向市场,坚持“知识增值”导向;组织协同层面,面向科技重大专项或重大工程的组织实施,建设一批可实现科技重点突破的协同创新平台。旨在助力科体协同创新工作实施。 展开更多
关键词 体协同创新 范式 内涵 组织运行 实践路向
下载PDF
双介质阻挡放电等离子体协同催化降解恶臭废气技术研究
7
作者 金成刚 李建鹏 +2 位作者 宋磊 刘京湘 刘东旭 《节能技术》 CAS 2023年第1期89-92,共4页
恶臭废气破坏环境的同时对周边居民生活造成很大困扰,而且还比较难以完全消除。本文提出了利用双介质阻挡放电(DBD)等离子体协同催化系统去除恶臭废气。系统采用排管式DBD模块,结合分段式催化模块。对垃圾处置中心外排臭气进行中试研究... 恶臭废气破坏环境的同时对周边居民生活造成很大困扰,而且还比较难以完全消除。本文提出了利用双介质阻挡放电(DBD)等离子体协同催化系统去除恶臭废气。系统采用排管式DBD模块,结合分段式催化模块。对垃圾处置中心外排臭气进行中试研究,并给出了将垃圾恶臭废气的综合治理方案。结果显示:单一双DBD等离子体输入功率在0.5~2 kW区间内,输入功率与臭气中各污染物的降解率呈现正相关,其中臭味浓度的降解率最高约为75%。采用双DBD等离子体协同催化恶臭废气的方式对O 3的平均催化分解率可达94%,臭味浓度的降解率由75%提高到95%。这对恶臭废气处理技术在电力工业等许多行业中应用具有重要的意义和价值。 展开更多
关键词 双介质阻挡 等离子 体协同催化 废气降解 工业应用
下载PDF
基于立体协控的信令风暴防范方法研究及应用
8
作者 陈东洋 《中国新通信》 2023年第14期71-77,共7页
5G时代,万物互联,然而网络中总会有一些意外,面对网络暴雷,如何让核心网信令风暴的雪球越滚越小,从而达到自愈呢。本文以日本电信运营商KDDI网络事故为引题,尝试分析KDDI事故原因,找出网络共性问题,进而给出一种新的信令风暴防控思路-... 5G时代,万物互联,然而网络中总会有一些意外,面对网络暴雷,如何让核心网信令风暴的雪球越滚越小,从而达到自愈呢。本文以日本电信运营商KDDI网络事故为引题,尝试分析KDDI事故原因,找出网络共性问题,进而给出一种新的信令风暴防控思路-立体协控;并举例介绍实际效果,使信令风暴得到有效预防,网络安全得到保障。 展开更多
关键词 拥塞 信令风暴 体协 智能终端
下载PDF
基于多智能体协同控制的直流输电系统故障恢复策略
9
作者 王俊棚 陈焕璋 +1 位作者 汪恒立 郭晓晨 《通信电源技术》 2023年第21期70-72,共3页
直流输电系统在现代电力系统中得到广泛应用,但其面临着故障引发的电网可靠性和稳定性问题。传统的故障恢复策略主要依靠中央控制器的指令下发和单一设备的操作,存在着集中控制和单点故障的风险。而多智能体协同控制作为一种分布式、协... 直流输电系统在现代电力系统中得到广泛应用,但其面临着故障引发的电网可靠性和稳定性问题。传统的故障恢复策略主要依靠中央控制器的指令下发和单一设备的操作,存在着集中控制和单点故障的风险。而多智能体协同控制作为一种分布式、协同的控制方式,通过多个智能体之间的协作和通信,可以实现更灵活、高效的系统控制。基于多智能体协同控制设计了一种针对直流输电系统的故障恢复策略,以提高系统的故障应对能力和恢复效率。 展开更多
关键词 直流输电系统 多智能体协同控制 故障恢复
下载PDF
多智能主体协作规划理论及其在RoboCup中的应用 被引量:2
10
作者 杜陶钧 黄鸿 《计算机仿真》 CSCD 2004年第7期125-128,共4页
机器人足球赛是近年人工智能迅速发展起来的一个重要的研究领域。基于此平台,研究了将规划、竞争、约束、协调纳入一个协作规划框架之中的多智能体协作规划理论,并将其分为5个阶段①产生协作目标;②协作规划;③寻求协作伙伴;④选择协作... 机器人足球赛是近年人工智能迅速发展起来的一个重要的研究领域。基于此平台,研究了将规划、竞争、约束、协调纳入一个协作规划框架之中的多智能体协作规划理论,并将其分为5个阶段①产生协作目标;②协作规划;③寻求协作伙伴;④选择协作方案;⑤实现所确定的目标。最后探讨了应用到机器人足球赛的一些技术问题。在比赛中,决策速度也较好。 展开更多
关键词 机器人足球赛 人工智能 多智能体协作规划 协作伙伴 形式化框架 多主体协作系统
下载PDF
多智能体协作技术综述 被引量:28
11
作者 杨煜普 李晓萌 许晓鸣 《信息与控制》 CSCD 北大核心 2001年第4期337-342,共6页
本文从协作模型和研究方法两个角度考察了多智能体协作技术的发展 ,认为是外在的理性形式化模型和内在的对策和学习机制是多智能体协作技术的两个重要方面 .
关键词 多智能体协 自协调模型 递归建模 MARKOV对策 智能控制
下载PDF
基于独立学习的多智能体协作决策 被引量:8
12
作者 李晓萌 杨煜普 许晓鸣 《控制与决策》 EI CSCD 北大核心 2002年第1期29-32,共4页
联合学习模式是实现多智能体协作决策的有效方法 ,但是当智能体信息不完备时 ,这一方法难以适用。为此 ,在智能体独立学习的基础上提出一种多智能体协作决策方法。以网格对策为例 。
关键词 独立学习 多智能体协作决策 智能控制 学习算法 联合学习模式
下载PDF
基于换位思考模型的多智能体协作研究及在RoboCup中的应用 被引量:5
13
作者 王浩 尚丽 +1 位作者 方宝富 李龙 《小型微型计算机系统》 CSCD 北大核心 2009年第5期959-962,共4页
机器人世界杯(RoboCup)是一个典型的多智能体系统.为了提高多智能体协作的效率,提出一种新的基于换位思考模型的多智能体协作研究方法.首先,教练智能体获取仿真比赛环境中球员智能体的无噪音信息,对所有队友智能体建模;然后,应用高斯分... 机器人世界杯(RoboCup)是一个典型的多智能体系统.为了提高多智能体协作的效率,提出一种新的基于换位思考模型的多智能体协作研究方法.首先,教练智能体获取仿真比赛环境中球员智能体的无噪音信息,对所有队友智能体建模;然后,应用高斯分布计算队友智能体的当前行为模式,并把当前模式反馈给仿真环境;最后,球员智能体根据换位思考模型计算得到的模式做出相应决策.该模型已经应用于HfutEngine2D仿真球队中,在RoboCup仿真比赛中获得2007年中国公开赛亚军,2008年机器人世界杯第7的好成绩. 展开更多
关键词 换位思考模型 多智能体协 智能体建模
下载PDF
二氯甲醛的光解离反应——三体协同非同步解离机理的第一个理论证据 被引量:2
14
作者 王郁文 李全松 +1 位作者 陈雪波 方维海 《化学学报》 SCIE CAS CSCD 北大核心 2003年第9期1343-1345,共3页
用CASSCF以及B3LYP和MP2从头算方法 ,研究了Cl2 CO的基态 ,最低激发单态和三态S0 ,S1,T1的势能剖面 .结果表明 ,Cl2 CO光分解为Cl+Cl+CO ,这一反应是通过协同非同步的机理实现的 .就目前所知 ,本研究关于二氯甲醛光解离反应的研究提供... 用CASSCF以及B3LYP和MP2从头算方法 ,研究了Cl2 CO的基态 ,最低激发单态和三态S0 ,S1,T1的势能剖面 .结果表明 ,Cl2 CO光分解为Cl+Cl+CO ,这一反应是通过协同非同步的机理实现的 .就目前所知 ,本研究关于二氯甲醛光解离反应的研究提供了三体协同非同步解离的第一个理论证据 . 展开更多
关键词 二氯甲醛 光解离反应 体协同非同步解离 解离机理 理论证据 从头计算
下载PDF
我国体育界民心工程中“满意度”的首例研究——以广州非奥运会项目体协的“满意度”调查研究为例 被引量:2
15
作者 龙秋生 谢发权 +1 位作者 许仲槐 邓芳华 《山东体育学院学报》 北大核心 2007年第6期47-49,共3页
体育社团的工作绩效已成为"民心工程"的一部分,体育环境、体育生活"满意度"将会成为广州和谐社会指标之一。对广州市非奥运项目体育协会综合经济实力和"满意度"进行比较,以促进整个体育事业的和谐发展。
关键词 单项体育协会 非奥运会项目体协 满意度 民心工程 体育环境 体育生活 广州
下载PDF
基于敏捷制造的虚拟企业多智能体协同生产管理 被引量:2
16
作者 高阳 曾小青 《武汉理工大学学报(信息与管理工程版)》 CAS 2003年第3期156-161,共6页
随着市场竞争的日益加剧并伴随着经济全球化趋势和信息技术的不断发展,一种以核心能力为特点对企业外部资源进行优化整合的合作形式———虚拟企业,正逐渐成为现代企业适应竞争环境的理想模式。自从虚拟企业的概念提出后它就受到学术界... 随着市场竞争的日益加剧并伴随着经济全球化趋势和信息技术的不断发展,一种以核心能力为特点对企业外部资源进行优化整合的合作形式———虚拟企业,正逐渐成为现代企业适应竞争环境的理想模式。自从虚拟企业的概念提出后它就受到学术界和企业界的广泛关注,并取得了一系列的研究成果。着重从虚拟企业协同生产管理的计划与调度及多智能体协作技术的角度,对虚拟企业运行阶段的研究情况进行了概括和论述,并展望了虚拟企业的发展趋势。 展开更多
关键词 虚拟企业 协同生产管理 计划 调度 多智能体协
下载PDF
普通高校学生体协工作初探 被引量:1
17
作者 杨军 《体育学刊》 CAS 1999年第4期47-49,共3页
高校体育工作的开展,不仅要依赖体育教师,更主要的是要发挥学生在体育活动中的主人翁作用,因此,本文就学生体协的组建、作用、实践进行了探索和总结,并提出今后发展的思路。
关键词 普通高校 学生体协工作
下载PDF
“四体协同”的中药学研究生培养模式的探索性研究 被引量:2
18
作者 周莉英 唐于平 王薇 《陕西中医药大学学报》 2019年第6期174-177,共4页
针对目前中药学学科研究生培养中存在的一些问题,本文采用建立校企联合培养平台、问卷调查、走访调研等方法,对中药学研究生尝试建立"培养目标-教育手段-培养制度-评价机制"四体协同的培养模式,为今后中药学学科乃至其他学科... 针对目前中药学学科研究生培养中存在的一些问题,本文采用建立校企联合培养平台、问卷调查、走访调研等方法,对中药学研究生尝试建立"培养目标-教育手段-培养制度-评价机制"四体协同的培养模式,为今后中药学学科乃至其他学科研究生培养探索一条新的途径和选择。 展开更多
关键词 研究生 体协 培养模式 探索
下载PDF
一种基于行为的多智能体协作策略设计 被引量:1
19
作者 章苏书 吴敏 +1 位作者 陈鑫 曹卫华 《机器人技术与应用》 2003年第5期42-44,共3页
本文提出了一种有效的多智能体协作策略 ,由一组动作控制器 ,一组行为单元和一个协调器组成。并将这种策略应用于足球机器人中型队Mirosot项目比赛 ,取得了良好效果。
关键词 足球机器人 多智能体协作策略 设计 行为控制算法 视觉系统
下载PDF
基于服务的多智能体协同开发环境
20
作者 江伟光 鲁建厦 +1 位作者 汤洪涛 李志鑫 《汽车工程》 EI CSCD 北大核心 2012年第10期952-957,共6页
针对汽车产品开发对分散化、异构化和智能化环境的需求,提出一种基于服务的多智能体协同开发策略。以产品开发管理(PDM)系统为基础信息平台,结合万维网服务的松耦合性和智能体的自治性,建立基于服务的多智能体协同开发体系结构;分析了... 针对汽车产品开发对分散化、异构化和智能化环境的需求,提出一种基于服务的多智能体协同开发策略。以产品开发管理(PDM)系统为基础信息平台,结合万维网服务的松耦合性和智能体的自治性,建立基于服务的多智能体协同开发体系结构;分析了该体系下智能体的内部结构和协同方式。作为一个实例,以PDM系统为平台建立了汽车减振器产品协同开发环境,并以减振器的设计重用验证该策略的可行性和有效性。 展开更多
关键词 万维网服务 多智能体协同开发环境 产品数据管理
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部