期刊文献+
共找到7,268篇文章
< 1 2 250 >
每页显示 20 50 100
论人工智能体的模块化治理 被引量:1
1
作者 张欣 《东方法学》 北大核心 2024年第3期129-142,共14页
人工智能体由控制端、感知端和行动端组成。在控制端,尽管大模型充当了智能体的“智能引擎”,但仍存在“机器幻觉”,其生成的内容面临时效性和可靠性风险。大模型的算法偏见也可能加剧智能体在决策中的偏见。在感知端,智能体的多模态感... 人工智能体由控制端、感知端和行动端组成。在控制端,尽管大模型充当了智能体的“智能引擎”,但仍存在“机器幻觉”,其生成的内容面临时效性和可靠性风险。大模型的算法偏见也可能加剧智能体在决策中的偏见。在感知端,智能体的多模态感知能力加大了个人隐私侵权的风险,对个人信息保护制度构成挑战。多智能体系统间的交互可能导致不可预测的、复杂的和动态的系统性安全风险。在行动端,具身智能体的交互式学习模式可能导致全面的、侵入性的隐私风险。智能体的嵌入式和中介化部署方式将深度影响人类的主体性。其高度定制化的部署特性还会面临人工智能对齐的挑战。面向“代理即服务”的产业链特点,应建立从基础模型到基础代理的模块化治理框架。针对具体的高风险场景,应探索精准化治理机制。鉴于人工智能体的生态特性,应着力推进交互式治理。 展开更多
关键词 人工智能 通用人工智能 人工智能治理 模块化治理 大模型 精准化治理
下载PDF
大模型智能体:概念、前沿和产业实践
2
作者 周涛 李鑫 +1 位作者 周俊临 李奕 《电子科技大学学报(社科版)》 2024年第4期57-62,共6页
从符号型和反应型智能体到基于强化学习和迁移学习的智能体,再到当前基于大模型的智能体,AI智能体经历了三代发展,逐渐成为人工智能研究和应用的核心。其中基于大模型的智能体是能够更准确地感知环境、进行反应和判断、形成并执行决策... 从符号型和反应型智能体到基于强化学习和迁移学习的智能体,再到当前基于大模型的智能体,AI智能体经历了三代发展,逐渐成为人工智能研究和应用的核心。其中基于大模型的智能体是能够更准确地感知环境、进行反应和判断、形成并执行决策的智能计算实体,在多个领域展现出广泛的应用前景,包括图像生成、视频生成、数据分析、图文修改辅助、谈判指导、教育教学、学术研究、生活助手、网站开发等。OpenAI、Google、Apple、NVIDIA等国外厂商,以及腾讯、百度、商汤、联想、讯飞等国内厂家,都在大模型智能体领域进行了积极的探索与实践,推出了各自的大模型智能体产品,涵盖了游戏、生活、线上助手、营销、教育等多个领域。本文将回顾AI智能体的定义与发展,着重介绍大模型智能体的概念和发展前沿,以及大模型智能体在产业实践方面的代表性成果,为有志于大模型智能体研究和开发的读者提供参考。 展开更多
关键词 人工智能 大模型 AI智能 大模型智能
下载PDF
基于大模型的态势认知智能体
3
作者 孙怡峰 廖树范 +1 位作者 吴疆 李福林 《指挥控制与仿真》 2024年第2期1-7,共7页
针对战场态势信息众多、变化趋势认知困难的问题,提出基于大模型的态势认知智能体框架和智能态势认知推演方法。从认知概念出发,结合智能体的抽象性、具身性特点,明确了智能体构建的3个关键环节:学习环境、记忆方式和产生知识机制;设计... 针对战场态势信息众多、变化趋势认知困难的问题,提出基于大模型的态势认知智能体框架和智能态势认知推演方法。从认知概念出发,结合智能体的抽象性、具身性特点,明确了智能体构建的3个关键环节:学习环境、记忆方式和产生知识机制;设计了战场态势认知智能体架构,包括记忆部件、规划部件、执行部件、评估部件以及智能体训练要点。在长期记忆部件中,围绕战场复杂状态建模特点,分析大语言模型、多模态大模型、大序列模型的运用问题。 展开更多
关键词 大模型 态势认知 智能 通用人工智能
下载PDF
基于平均一致协议的分布式自适应多智能体聚集控制
4
作者 谢光强 钟必为 李杨 《计算机科学》 CSCD 北大核心 2024年第5期242-249,共8页
分布式聚集控制问题是多智能体协同控制中的一个重要问题。由于智能体的可移动性和感知能力有限,传统的分布式聚集算法难以保证连通性,从而聚集成多个簇群。此外,去中心化的大规模聚集控制给获取全局聚集点带来了巨大的挑战。针对连通... 分布式聚集控制问题是多智能体协同控制中的一个重要问题。由于智能体的可移动性和感知能力有限,传统的分布式聚集算法难以保证连通性,从而聚集成多个簇群。此外,去中心化的大规模聚集控制给获取全局聚集点带来了巨大的挑战。针对连通性保护问题,基于平均一致协议与约束集,提出了一个带有连通性约束的多智能体聚集协议(Multi-Agent Rendezvous Protocol with Connectivity constraints,MARP-CC)。然后针对聚集点无法预测的问题,提出了位置合成(Location Synthesis Strategy,LSS)和位置重定向(Location Redirection Strategy,LRS)两种控制策略。智能体根据当前连通情况,自适应选择最优的控制策略进行迭代。结合这两种控制策略,提出了带连通性约束的分布式自适应多智能体聚集算法(Distributed Adaptive Multi-Agent Rendezvous algorithm with Connectivity Constraints,DAMAR-CC)。对算法的收敛性和连通性进行了分析,并通过大量的仿真说明了DAMAR-CC可以引导智能体稳定地聚集在初始拓扑的几何中心。 展开更多
关键词 平均一致 连通性保持 多智能聚集 约束集
下载PDF
重放攻击下多智能体系统H_(∞)一致性PID控制
5
作者 宋金波 董宏丽 +1 位作者 申雨轩 侯男 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第4期658-666,共9页
本文针对一类带有加性噪声和乘性噪声的离散多智能体系统,研究重放攻击下多智能体系统的H_(∞)一致性比例-积分-微分(PID)控制问题.首先,根据智能体的测量输出设计状态观测器,对智能体的状态进行有效估计,观测器设计过程中考虑了系统测... 本文针对一类带有加性噪声和乘性噪声的离散多智能体系统,研究重放攻击下多智能体系统的H_(∞)一致性比例-积分-微分(PID)控制问题.首先,根据智能体的测量输出设计状态观测器,对智能体的状态进行有效估计,观测器设计过程中考虑了系统测量输出从传感器传输到观测器过程中受到重放网络攻击的影响.然后,利用智能体与其邻居智能体的估计状态差设计PID控制器.利用李雅普诺夫稳定性理论和代数图论,证明在该控制策略下,多智能体系统在重放攻击存在的情况下达到预期的H_(∞)性能指标.最后,利用线性矩阵不等式(LMI)方法求解观测器和控制器增益,利用数值仿真验证了所设计的观测器和PID控制器的有效性. 展开更多
关键词 多智能 重放攻击 PID控制 H_(∞)性能 观测器
下载PDF
基于AttentionR2U-net的岩石(体)关键节理智能识别与参数提取
6
作者 孙浩 代宗晟 +1 位作者 金爱兵 陈岩 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期101-110,共10页
针对岩石(体)表面复杂节理网中关键节理的智能识别与参数提取问题,提出一种基于AttentionR2U-net网络与节理几何特征模型耦合识别的方法.在R2U-net网络的基础上引入注意门(attentiongate)改进网络,通过定性与定量的方法对边坡节理图像... 针对岩石(体)表面复杂节理网中关键节理的智能识别与参数提取问题,提出一种基于AttentionR2U-net网络与节理几何特征模型耦合识别的方法.在R2U-net网络的基础上引入注意门(attentiongate)改进网络,通过定性与定量的方法对边坡节理图像和混凝土、龟裂土、常见脆性岩石裂隙图像的识别结果分别作准确性及泛化能力检验;利用AttentionR2U-net网络耦合节理几何特征的方法识别关键节理,提取原始节理和关键节理的几何参数并对其迹长、面积及倾角作差异性分析.研究结果表明:针对岩石(体)节理识别,本文算法的Dice相似系数从U-net网络的0.965提升至0.990,且明显优于传统算法,故本文算法在岩石(体)节理识别上具有更强的可靠性与优越性;针对混凝土、龟裂土和大理岩、花岗岩、砂岩等脆性岩石裂隙的识别,本文算法的Dice相似系数均在0.953以上,故本文算法具有较强的泛化能力.与原始节理网络相比,关键节理网络优势迹长由0.732m显著增大至1.835m,节理倾角分布形式和优势倾角组均不变,优势迹长和倾角的节理占比均显著增大. 展开更多
关键词 岩石() 关键节理 AttentionR2U-net网络 智能识别 参数提取
下载PDF
多智能体深度强化学习研究进展
7
作者 丁世飞 杜威 +2 位作者 张健 丽丽 丁玲 《计算机学报》 EI CAS CSCD 北大核心 2024年第7期1547-1567,共21页
深度强化学习(Deep Reinforcement Learning,DRL)在近年受到广泛的关注,并在各种领域取得显著的成功.由于现实环境通常包括多个与环境交互的智能体,多智能体深度强化学习(Multi-Agent Deep Reinforcement Learning,MADRL)获得蓬勃的发展... 深度强化学习(Deep Reinforcement Learning,DRL)在近年受到广泛的关注,并在各种领域取得显著的成功.由于现实环境通常包括多个与环境交互的智能体,多智能体深度强化学习(Multi-Agent Deep Reinforcement Learning,MADRL)获得蓬勃的发展,在各种复杂的序列决策任务上取得优异的表现.本文对多智能体深度强化学习的工作进展进行综述,主要内容分为三个部分.首先,我们回顾了几种常见的多智能体强化学习问题表示及其对应的合作、竞争和混合任务.其次,我们对目前的MADRL方法进行了全新的多维度的分类,并对不同类别的方法展开进一步介绍.其中,我们重点综述值函数分解方法,基于通信的MADRL方法以及基于图神经网络的MADRL方法.最后,我们研究了MADRL方法在现实场景中的主要应用.希望本文能够为即将进入这一快速发展领域的新研究人员和希望获得全方位了解并根据最新进展确定新方向的现有领域专家提供帮助. 展开更多
关键词 多智能深度强化学习 基于值函数 基于策略 通信学习 图神经网络
下载PDF
基于分层邻域选择的切换拓扑多智能体系统一致性协议
8
作者 谢光强 万梓坤 李杨 《广东工业大学学报》 CAS 2024年第4期44-51,共8页
在切换拓扑的多智能体系统中,针对高低密度信息减弱一致性的问题,提出了一种基于分层邻域选择算法(Layered Neighbor Selection,LNS),该算法对智能体的邻域进行层次划分,从每层中选取具有代表性的邻居智能体进行通信、状态更新和状态演... 在切换拓扑的多智能体系统中,针对高低密度信息减弱一致性的问题,提出了一种基于分层邻域选择算法(Layered Neighbor Selection,LNS),该算法对智能体的邻域进行层次划分,从每层中选取具有代表性的邻居智能体进行通信、状态更新和状态演化,然后设计了层次调整策略和层次融合策略来加快收敛速度,最后设计了分层邻域选择一致性协议,且给出了层数对收敛的影响。现有的一致性协议,收敛效果受限于特定密度范围,受不同密度的影响较大,而本文提出的协议能适应不同密度范围,并在系统稳定的条件下提升收敛速度,且通过李雅普诺夫函数法证明了一致性协议的稳定性。最后通过仿真实验,并与几种一致性协议进行比较,验证了所设计的一致性协议能有效加快系统收敛速度。 展开更多
关键词 多智能系统 一致性 切换拓扑 分层邻域选择 李雅普诺夫函数
下载PDF
基于产品数字孪生体的智能制造价值链协同研发框架构建
9
作者 袁峰 李清蕾 邱爱莲 《科技管理研究》 2024年第2期98-105,共8页
新一代信息技术环境下制造企业研发涉及更多价值主体,需要新技术推进系统集成创新和快速迭代,为全价值链的协同研发提供支持。为应对当前智能制造价值链延伸带来的研发决策离散问题,从全局角度出发,提出基于产品数字孪生体的智能制造价... 新一代信息技术环境下制造企业研发涉及更多价值主体,需要新技术推进系统集成创新和快速迭代,为全价值链的协同研发提供支持。为应对当前智能制造价值链延伸带来的研发决策离散问题,从全局角度出发,提出基于产品数字孪生体的智能制造价值链协同研发的理念。首先在界定产品数字孪生体和智能制造价值链的内涵基础上,推演基于产品数字孪生体的智能制造价值链的逻辑机制,包括形成研发闭环、实现功能重塑。其次,将产品数字孪生体与智能制造价值链相结合,借助数字孪生体的强大整合能力,基于动态采集、模型互操作、虚实空间双向感知的系统研发要求,构建具有互联、互操作、互感知特性的智能制造价值链协同研发框架。最后,从跨时空并行协同、快速迭代、研发生态3个角度,打造基于产品数字孪生体的智能制造价值链协同研发应用场景,使分布于不同时空的智能制造各价值链主体并行协同完成产品研发,以期为智能制造企业全价值链协同研发提供参考。 展开更多
关键词 产品数字孪生 智能制造 全价值链 产品研发 多主研发 协同研发
下载PDF
基于异构多智能体自注意力网络的路网信号协调顺序优化方法
10
作者 陈喜群 朱奕璋 +2 位作者 谢宁珂 耿茂思 吕朝锋 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第3期114-126,共13页
针对路网交通信号控制的复杂性,本文提出基于异构多智能体自注意力网络的路网信号协调顺序优化方法,提升路网范围内多交叉口信号控制策略性能。首先,模型考虑多交叉口交通流的空间相关性,采用基于自注意力机制的价值编码器学习交通观测... 针对路网交通信号控制的复杂性,本文提出基于异构多智能体自注意力网络的路网信号协调顺序优化方法,提升路网范围内多交叉口信号控制策略性能。首先,模型考虑多交叉口交通流的空间相关性,采用基于自注意力机制的价值编码器学习交通观测表征,实现路网级通信;其次,面向多智能体策略更新的非稳态环境,模型在前序智能体的联合动作基础上,基于多智能体优势分解的策略解码器,顺序决策最优反应动作;最后,设计基于有效行驶车辆的动作掩码机制,在时效完备区间自适应调节决策频率,并提出考虑等待公平性的时空压力奖励函数,进一步提高策略性能与实用性。在杭州路网数据集上验证模型有效性,结果表明:所提模型在2个数据集和5个性能指标上均优于基准模型;相比最优基准模型,所提模型平均行程时间降低10.89%,平均排队长度降低18.84%,平均等待时间降低22.21%。此外,所提模型的泛化能力更强,且显著减少车辆等待时间过长的情形。 展开更多
关键词 智能交通 深度强化学习 路网信号控制 异构多智能 时空压力奖励
下载PDF
基于双视角建模的多智能体协作强化学习方法
11
作者 刘全 施眉龙 +1 位作者 黄志刚 张立华 《计算机学报》 EI CAS CSCD 北大核心 2024年第7期1582-1594,共13页
在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建... 在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建模的多智能体协作强化学习方法(Bi-ViewModelingCollaborative Multi-Agent Reinforcement Learning,简称BVM-CMARL).该方法从局部和全局两个视角对智能体进行建模,分别用于产生多样性的策略和激励协作.在局部视角最大化局部变分与自身轨迹的互信息,激励智能体的策略多样性;同时在全局视角最大化全局变分与其他智能体动作的互信息,提高智能体协作水平.最后将局部变分训练出的局部Q值与全局变分训练出的全局Q值合并,避免低效协作.将BVM-CMARL算法应用于星际争霸多智能体挑战赛(StarCraft Multi-AgentChallenge,SMAC)中的等级觅食(Level-BasedForaging,LBF)和走廊(Hallway)等环境,与QMIX、QPLEX、RODE、EOI和MAVEN等5种目前优秀的强化学习算法相比,BVM-CMARL算法具有更好的稳定性和性能表现,在SMAC上的平均胜率为82.81%,比次优算法RODE高13.42%.通过设计模型变体,在消融实验中证明了双视角建模对BVM-CMARL的必要性. 展开更多
关键词 深度强化学习 多智能系统 多智能协作 协作建模 对比学习
下载PDF
人工智能体执法并承担执法责任的可能性
12
作者 宋华琳 唐曼 《学习与实践》 北大核心 2024年第4期34-43,F0002,共11页
人工智能体执法正成为数字法治政府建设的重要表现,将会对以人的行为作为逻辑底色而建构的法律秩序形成冲击。人工智能体或许可以拥有有限的法律人格及有限的责任能力,并为一般行为承担法律责任,但却可能面临执法权行使正当性与执法能... 人工智能体执法正成为数字法治政府建设的重要表现,将会对以人的行为作为逻辑底色而建构的法律秩序形成冲击。人工智能体或许可以拥有有限的法律人格及有限的责任能力,并为一般行为承担法律责任,但却可能面临执法权行使正当性与执法能力不足的困境。因此,人工智能体不适宜执法或行使公权力,只能承担事务性公务,其执行公务引起的责任可由人工智能体自身、供应商以及行政机关共同承担。 展开更多
关键词 人工智能 执法主 执法责任
下载PDF
分布式事件触发下的多智能体系统二分一致性
13
作者 王君 韦娅萍 《兰州理工大学学报》 CAS 北大核心 2024年第3期77-83,共7页
研究了基于分布式事件触发的多智能体控制系统中的二分一致性问题,设计了一种合作和竞争并存拓扑结构的一致性控制协议,使多智能体系统收敛于二模相同且符号不同的状态.在图论与矩阵论的基础上,将多智能体系统的二分一致性问题转化为闭... 研究了基于分布式事件触发的多智能体控制系统中的二分一致性问题,设计了一种合作和竞争并存拓扑结构的一致性控制协议,使多智能体系统收敛于二模相同且符号不同的状态.在图论与矩阵论的基础上,将多智能体系统的二分一致性问题转化为闭环误差系统的稳定性问题,通过建立一个合适的Lyapunov函数,验证了闭环误差系统渐进稳定,且针对每个智能体提出了事件触发条件,以减少控制更新频率与通信资源的损耗,同时证明每个智能体相邻触发时间间隔都有严格的正下界,即避免了Zeno现象,最后利用仿真实例验证了所提方法的可行性和有效性. 展开更多
关键词 多智能系统 符号图 二分一致性 事件触发
下载PDF
教育智能体情绪线索赋能在线学习的模型构建及实践研究
14
作者 朱珂 卞茗慧 王东 《远程教育杂志》 北大核心 2024年第3期68-78,112,共12页
教育数字化转型会带来课程内容、教学活动等要素的内涵及其关系的变化,在线学习和混合教学等数字化学习方式将成为主流教学方式。在线学习带来诸多优越性的同时,也存在师生交互缺失、情绪交流缺乏的问题。虚拟学习环境中具有情绪线索的... 教育数字化转型会带来课程内容、教学活动等要素的内涵及其关系的变化,在线学习和混合教学等数字化学习方式将成为主流教学方式。在线学习带来诸多优越性的同时,也存在师生交互缺失、情绪交流缺乏的问题。虚拟学习环境中具有情绪线索的教育智能体为破解该问题提供了一种更加智慧化的手段。教育智能体是用于在线学习环境以满足不同教学目标要求、类似教师的虚拟角色,可为学习者提供认知和情感支持。然而,已有研究关于教育智能体情绪线索对在线学习全过程的作用效果尚未达成共识。为此,从动机、情绪、理解、巩固和迁移5个角度对2003年以来国内外42个相关实证研究进行了系统性分析,构建教育智能体情绪线索赋能在线学习的理论模型,并结合问卷量表法、社会网络分析法和内容分析法对高校专业课教学进行实践探究。结果表明:(1)情绪智能体组学习者的学习动机在实验前后呈现了最大幅度的提升,且存在显著高效应;(2)情绪智能体组学习者协作交互的积极性在增加,交互水平也在提升,学习热情最高;(3)情绪智能体组学习者的内部和外部认知负荷无明显变化,而相关认知负荷显著增加,促进其新知的掌握;(4)教育智能体情绪线索助力学习者记住更多的项目,从而提高了其知识保持成绩;(5)教育智能体情绪线索可以帮助学习者对更高层次的反思进行深度构建,从而发展了反思能力,也反映了其迁移能力的提升。最后,针对教育智能体的设计提出建议,以期为在线学习提供更符合个性化需求的情感认知工具,推动人工智能与教育的融合发展。 展开更多
关键词 教育智能 情绪线索 在线学习 模型构建 实践探究
下载PDF
基于多智能体模型的柑桔木虱空间扩散研究
15
作者 邓铁军 张迈 +3 位作者 申垚阳 刘丽辉 李运秋 叶新平 《中国南方果树》 北大核心 2024年第4期10-17,24,共9页
柑桔黄龙病是严重危害我国柑桔产业的细菌性病害,柑桔木虱是柑桔黄龙病的唯一自然传播媒介,了解柑桔木虱的发生和空间扩散规律对于有效控制柑桔黄龙病具有重要意义。以广西壮族自治区蒙山县为具体研究区域,借助NetLogo智能体建模平台构... 柑桔黄龙病是严重危害我国柑桔产业的细菌性病害,柑桔木虱是柑桔黄龙病的唯一自然传播媒介,了解柑桔木虱的发生和空间扩散规律对于有效控制柑桔黄龙病具有重要意义。以广西壮族自治区蒙山县为具体研究区域,借助NetLogo智能体建模平台构建了柑桔木虱空间扩散的模拟模型,模拟并评价了柑桔木虱的空间扩散规律及不同田间管理的效果。模型模拟结果表明,扩散距离以及农药喷施间隔时间均对柑桔木虱扩散速度和空间分布产生明显影响。无田间管理措施时,柑桔木虱扩散风险区总面积占柑桔园面积的比例呈现为持续且快速的上升趋势,长距离扩散(风速≥5 m/s)会导致风险区面积明显增加。当间隔1个月及以内施药(规范田间管理)时,柑桔木虱扩散风险能够得到迅速而有效的控制。验证结果显示,模型的平均TSS值达到0.82,模型仿真灵敏性为85.2%,模型特异性为80.9%,模型仿真结果总体准确率为83.3%,模型能够很好地模拟研究区内柑桔木虱的空间扩散。基于研究结果,建议柑桔种植区合理优化果园空间布局,如采用棋盘式分布,区域间设置防风林或防虫网等进行物理阻隔,田间严格遵循高效农药的使用规定进行柑桔木虱的有效防治,以有效减缓柑桔木虱扩散速度和空间范围,为柑桔黄龙病的区域防控提供有力支持。 展开更多
关键词 柑桔木虱 多智能模型 空间生态学 NETLOGO
下载PDF
技术与法学共视下人工智能体的角色定位
16
作者 王燕玲 《南都学坛(南阳师范学院人文社会科学学报)》 2024年第2期62-72,共11页
当前人工智能体的刑事责任问题研究整体上仍限于刑法学,应在技术和法学共视下展开一体化探讨。在技术原理上,人工智能体属于机器,不具有自我意识,因而不具有类人般的智能性;认可人工智能体具备刑事责任主体资格的刑法学观点,属假设性理... 当前人工智能体的刑事责任问题研究整体上仍限于刑法学,应在技术和法学共视下展开一体化探讨。在技术原理上,人工智能体属于机器,不具有自我意识,因而不具有类人般的智能性;认可人工智能体具备刑事责任主体资格的刑法学观点,属假设性理论构想,当前缺乏技术原理上的现实基础。在技术视野下,人工智能体之“刑罚措施”等同机器处置,逻辑上不具有可行性,近乎幻想。人工智能体的刑法定位应归结为对人工智能体的开发者和使用者进行规制,从而保障人工智能在各种应用场景下的安全使用。 展开更多
关键词 法律 技术 人工智能 刑事责任 角色定位
下载PDF
作战方案驱动的可学习兵棋推演智能体研究
17
作者 孙怡峰 李智 +1 位作者 吴疆 王玉宾 《系统仿真学报》 CAS CSCD 北大核心 2024年第7期1525-1535,共11页
为了使智能体能够应对兵棋推演中的复杂作战场景和作战目的,提出作战方案驱动的可学习兵棋推演智能体架构。剖析智能体对兵棋系统的“依附特性”和“松耦合特性”,得到智能体的可学习要求;在智能体框架设计中,使用作战方案压减智能体学... 为了使智能体能够应对兵棋推演中的复杂作战场景和作战目的,提出作战方案驱动的可学习兵棋推演智能体架构。剖析智能体对兵棋系统的“依附特性”和“松耦合特性”,得到智能体的可学习要求;在智能体框架设计中,使用作战方案压减智能体学习范围。通过有限状态机对应作战方案中的作战阶段知识,依据作战方案框架确定智能体决策空间,设计可学习的深层神经网络实施关键决策空间探索,神经网络采用先验知识模仿学习模式和深度强化学习模式。该架构能迭代探索人类难以充分梳理清楚的多棋子最优部署和协作问题。 展开更多
关键词 兵棋推演 智能 作战方案 深层神经网络 强化学习 模仿学习
下载PDF
基于元启发式优化的机器人智能体无碰撞轨迹规划
18
作者 谢宗武 马博宇 +3 位作者 孙万东 杨晓航 姬一明 谢光虎 《载人航天》 CSCD 北大核心 2024年第4期510-515,共6页
针对机器人智能体在复杂三维环境中的安全运动,提出一种基于元启发式优化的无碰撞轨迹规划方案。轨迹点采用五次样条插值,以确保运动轨迹足够平滑,且起始点和目标点的速度与加速度均为零。以轨迹长度最短为优化目标,将轨迹与障碍物的最... 针对机器人智能体在复杂三维环境中的安全运动,提出一种基于元启发式优化的无碰撞轨迹规划方案。轨迹点采用五次样条插值,以确保运动轨迹足够平滑,且起始点和目标点的速度与加速度均为零。以轨迹长度最短为优化目标,将轨迹与障碍物的最近距离限制在约束条件中,从而表述为一个优化问题,并采用基于元启发式的灰狼算法进行求解。随后,在复杂的三维地形中对该方案开展2个模拟仿真。结果表明:该方案能够有效地在规划空间内求解出预定数目的最优轨迹插值点,通过五次样条插值形成的轨迹长度达到最短,且不与障碍物发生任何碰撞。 展开更多
关键词 机器人智能 轨迹规划 无碰撞 五次样条插值 灰狼算法 元启发式
下载PDF
基于自适应分布式滤波观测器的多智能体系统编队控制
19
作者 高焕丽 李玮 +1 位作者 孟伟 蔡鹤 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第4期729-737,共9页
本文考虑了全局指令系统输出信息受到信道扰动情况下线性多智能体系统的编队控制问题.首先,基于协作式输出调节理论框架对线性多智能体系统的编队控制问题进行数学建模.其次,针对受到信道扰动的全局指令系统输出信息,提出了一类基于受... 本文考虑了全局指令系统输出信息受到信道扰动情况下线性多智能体系统的编队控制问题.首先,基于协作式输出调节理论框架对线性多智能体系统的编队控制问题进行数学建模.其次,针对受到信道扰动的全局指令系统输出信息,提出了一类基于受扰输出的自适应分布式滤波观测器,在降低网络信息交换量的同时消除扰动的影响.最后,设计了输出反馈确定等价控制律,解决了线性多智能体系统的分布式编队控制问题.给出了数值仿真结果检验控制性能. 展开更多
关键词 多智能系统 编队控制 协作式输出调节 分布式滤波观测器
下载PDF
多智能体协同控制平台构建与实践课程设计
20
作者 施吉祥 陈建松 张宁 《科技风》 2024年第18期43-45,共3页
本文以多智能体协同控制平台的构建为基础,结合高校本科生创新创业类课程改革与建设为背景,探讨多智能体模块实践课程的实施方案和教学模式。平台的搭建涉及无人机、智能车、无线通信网络、室内实时定位系统等硬件的配置,以及Simulink... 本文以多智能体协同控制平台的构建为基础,结合高校本科生创新创业类课程改革与建设为背景,探讨多智能体模块实践课程的实施方案和教学模式。平台的搭建涉及无人机、智能车、无线通信网络、室内实时定位系统等硬件的配置,以及Simulink虚拟仿真、实时控制系统开发等软件平台,可以为机械工程、自动化、人工智能等相关专业的建设与人才培养提供实践教学环境。在实践平台建设的基础上,分层次递进式开展教学,设计了可以满足从认知到通识再到创新及工程等不同阶段学时要求的实践课程,课程和实践环节的开展以兴趣为引导,前沿技术为支撑,通过虚实结合、项目式教学、赛教结合等方式实施,目标为学生开阔视野、培养学生综合实践能力、服务创新创业活动。 展开更多
关键词 多智能系统 无人机 虚拟仿真 实践教学
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部