期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于工业CT图像的刚体切片厚度智能确定方法 被引量:3
1
作者 徐雪慧 《兵器材料科学与工程》 CAS CSCD 北大核心 2020年第6期129-132,共4页
为准确测量刚体切片厚度,提出基于工业CT图像的智能确定方法。用自适应加权均值滤波法对CT图像预处理,去除图像中的噪声;基于Facet模型的图像边缘提取法,提取预处理图像的待测壁边缘像素;用内、外边缘完成边缘跟踪,将内、外边界点信息... 为准确测量刚体切片厚度,提出基于工业CT图像的智能确定方法。用自适应加权均值滤波法对CT图像预处理,去除图像中的噪声;基于Facet模型的图像边缘提取法,提取预处理图像的待测壁边缘像素;用内、外边缘完成边缘跟踪,将内、外边界点信息存储在结构数组中,获取每个边界点至外缘边界点最短距离,将最短距离相加后除以内缘边界点数,得出刚体厚度像素,将厚度像素与像素当量相乘,得出刚体厚度。结果表明:该方法能有效测量刚体厚度,误差率低于0.39%,去噪效果好,测量结果不受切片长度影响。 展开更多
关键词 工业CT图像 刚体切片厚度 智能确定 边缘提取法 FACET模型 边缘像素
下载PDF
基于参数化的榫卯尺寸智能确定方法 被引量:4
2
作者 汤琳 关惠元 《北京林业大学学报》 CAS CSCD 北大核心 2021年第3期145-154,共10页
【目的】榫卯结构尺寸的确定是编写榫卯数控加工代码的前提,也是实现榫卯数控加工的基础,但现有的通过反复修改榫卯几何模型确定榫卯尺寸的方式,效率低、难度高,严重影响了榫卯数字化加工的发展。因此,有必要设计一种榫卯尺寸智能化确... 【目的】榫卯结构尺寸的确定是编写榫卯数控加工代码的前提,也是实现榫卯数控加工的基础,但现有的通过反复修改榫卯几何模型确定榫卯尺寸的方式,效率低、难度高,严重影响了榫卯数字化加工的发展。因此,有必要设计一种榫卯尺寸智能化确定的方法。【方法】以改良型格肩榫为例,首先利用参数化的设计思想,建立格肩榫的数学模型并提取了格肩榫尺寸参数;然后根据榫卯装配体零件的特征,基于装配约束,从位置关系和配合关系两个角度,建立格肩榫尺寸参数间的关系函数;再基于工艺约束,从数控加工方式、市场调研结果和工艺知识这3个方面,确定部分尺寸的取值范围和预设参考值,并建立尺寸参数与工艺约束间的关联函数;最后,以零件的断面尺寸为输入参数,整合关联函数、取值范围和预设参考值,建立尺寸参数关联函数表。【结果】通过建立榫卯数学模型,提取了榫卯各类尺寸参数;根据榫卯装配和工艺约束,成功建立了榫卯尺寸参数间的函数关联,并获取了尺寸参数的取值范围和预设推荐值;通过建立尺寸参数关联函数表,实现了只需输入榫卯零件的断面尺寸,系统就可以自动输出榫卯其他尺寸参数值。【结论】在装配和工艺两方面综合约束函数基础上建立的榫卯尺寸智能确定方法,是对榫卯工艺知识的数字化整理和重用,不仅能实现榫卯尺寸的智能确定,也为实现榫卯乃至实木加工的智能制造提供了基础条件。 展开更多
关键词 榫卯 尺寸设计 参数化 智能确定 装配约束 工艺约束
下载PDF
基于双评论家的多智能体深度确定性策略梯度方法 被引量:1
3
作者 丁世飞 杜威 +2 位作者 郭丽丽 张健 徐晓 《计算机研究与发展》 EI CSCD 北大核心 2023年第10期2394-2404,共11页
在现实世界的复杂多智能体环境中,任务的完成通常需要多个智能体之间的相互协作,这促使各种多智能体强化学习方法不断涌现.动作价值函数估计偏差是单智能体强化学习领域中备受关注的一个重要问题,而在多智能体环境中却鲜有研究.针对这... 在现实世界的复杂多智能体环境中,任务的完成通常需要多个智能体之间的相互协作,这促使各种多智能体强化学习方法不断涌现.动作价值函数估计偏差是单智能体强化学习领域中备受关注的一个重要问题,而在多智能体环境中却鲜有研究.针对这一问题,分别从理论和实验上证明了多智能体深度确定性策略梯度方法存在价值函数被高估.提出基于双评论家的多智能体深度确定性策略梯度(multiagent deep deterministic policy gradient method based on double critics,MADDPG-DC)方法,通过在双评论家网络上的最小值操作来避免价值被高估,进一步促进智能体学得最优的策略.此外,延迟行动者网络更新,保证行动者网络策略更新的效率和稳定性,提高策略学习和更新的质量.在多智能体粒子环境和交通信号控制环境上的实验结果证明了所提方法的可行性和优越性. 展开更多
关键词 强化学习 价值估计 双评论家 交通信号控制 智能体深度确定性策略梯度
下载PDF
网络攻击不确定多智能体混合触发一致性
4
作者 王梦阳 于冰 陈侠 《电光与控制》 CSCD 北大核心 2023年第11期85-93,104,共10页
研究了具有网络攻击和不确定多智能体系统混合触发一致性问题。考虑到传统的时间触发机制和事件触发机制均不能保证系统的最佳性能,采用了更具效用的混合触发机制,其中,事件触发机制与时间触发机制之间的切换服从随机的伯努利分布,事件... 研究了具有网络攻击和不确定多智能体系统混合触发一致性问题。考虑到传统的时间触发机制和事件触发机制均不能保证系统的最佳性能,采用了更具效用的混合触发机制,其中,事件触发机制与时间触发机制之间的切换服从随机的伯努利分布,事件触发机制的任意两个相邻的触发间隔大于等于一个采样周期,从而有效地节约网络资源。同时考虑了时变延时控制输入、模型误差、外部干扰以及网络攻击对系统的影响,构造了闭环多智能体系统的数学模型。根据李雅普诺夫渐近稳定性理论和线性矩阵不等式理论,给出了混合触发机制下多智能体系统的一致性定理。最后,通过仿真实验验证了该理论的有效性及可行性。 展开更多
关键词 时间延时 网络攻击 确定智能 混合触发机制 一致性
下载PDF
基于多智能体深度强化学习的无人艇集群博弈对抗研究
5
作者 于长东 刘新阳 +2 位作者 陈聪 刘殿勇 梁霄 《水下无人系统学报》 2024年第1期79-86,共8页
基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务。首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟... 基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务。首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟具体作战场景平台,设计多智能体网络模型、奖励函数机制以及训练策略。实验结果表明,文中方法可以有效应对敌方无人艇的协同围捕决策问题,在不同作战场景下具有较高的效率,为未来复杂作战场景下无人艇智能决策研究提供理论参考价值。 展开更多
关键词 无人艇集群 智能体深度确定性策略梯度算法 深度强化学习 智能决策 博弈对抗
下载PDF
基于多智能体深度强化学习的多星观测任务分配方法
6
作者 王桢朗 何慧群 +1 位作者 周军 金云飞 《上海航天(中英文)》 CSCD 2024年第1期108-115,共8页
为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况... 为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况下,仍具有一定的自主协同能力及独立实现多星观测任务的高效分配能力。 展开更多
关键词 智能体系统 深度强化学习 多星系统 智能体深度确定性策略梯度算法 任务规划
下载PDF
基于多智能体深度确定策略梯度算法的有功-无功协调调度模型 被引量:17
7
作者 赵冬梅 陶然 +2 位作者 马泰屹 夏轩 王浩翔 《电工技术学报》 EI CSCD 北大核心 2021年第9期1914-1925,共12页
实现有功-无功协调调度是促成"未来一体化大电网调控系统"建设中的关键一环。为解决调度中存在反复调节、难以协调冲突等问题,采用多智能体技术,智能组织多种有功调控资源和无功调控资源,建立电网有功-无功协调调度模型;为解... 实现有功-无功协调调度是促成"未来一体化大电网调控系统"建设中的关键一环。为解决调度中存在反复调节、难以协调冲突等问题,采用多智能体技术,智能组织多种有功调控资源和无功调控资源,建立电网有功-无功协调调度模型;为解决电力系统环境在多智能体探索过程中出现的不稳定问题,采用多智能体深度确定策略梯度算法,设计适用于有功-无功协调调度模型的电力系统多智能体环境,构造智能体状态、动作和奖励函数。通过算例仿真和对比分析,验证所提模型及算法的有效性。 展开更多
关键词 智能 智能体深度确定策略梯度算法 策略迭代 灵活调控资源 有功-无功协调
下载PDF
集对分析在不确定性智能决策中的应用 被引量:8
8
作者 刘秀梅 赵克勤 《智能系统学报》 CSCD 北大核心 2020年第1期121-135,共15页
语言是思维的表达,智能决策是基于确定性与不确定性对立统一思维的一类高级决策。文章综述集对分析在纯自然语言决策,自然语言与数学混合语言决策,区间数决策和直觉模糊决策,集对分析粗糙集决策,联系数与马尔可夫链相结合的决策,赵森烽... 语言是思维的表达,智能决策是基于确定性与不确定性对立统一思维的一类高级决策。文章综述集对分析在纯自然语言决策,自然语言与数学混合语言决策,区间数决策和直觉模糊决策,集对分析粗糙集决策,联系数与马尔可夫链相结合的决策,赵森烽-克勤概率的贝叶斯决策,偏联系数的决策和同异反综合集成决策等方面的应用。特点是把基于确定性的决策建模与不确定性系统分析相结合,把系统宏观层次的分析与微观层次的分析相结合,把两种或多种决策方法综合集成,根据不确定性的具体情况给出决策建议,因而是一种立足于全局的智能决策,并认为集对分析的不确定性智能决策过程,在本质上是把决策系统中的信息能转换成智能的过程。 展开更多
关键词 确定智能决策 纯自然语言智能决策 混合智能决策 区间数决策 偏联系数决策 同异反集成决策 决策空间 集对分析
下载PDF
不确定性人工智能数据的证据分析 被引量:2
9
作者 高波 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2022年第2期73-82,共10页
由于人类在认识过程中表现出的智能和认知不可避免地伴随着不确定性,不确定性人工智能电子数据的可信性和证据分析的科学性问题也成为人们关注的重点。在司法实践中,需要通过区分基于有形物和基于语言(包括自然语言与人工语言)的证据属... 由于人类在认识过程中表现出的智能和认知不可避免地伴随着不确定性,不确定性人工智能电子数据的可信性和证据分析的科学性问题也成为人们关注的重点。在司法实践中,需要通过区分基于有形物和基于语言(包括自然语言与人工语言)的证据属性来审查不确定性人工智能电子数据的可信性。同时,基于贝叶斯网络,实践中还需要在不确定性人工智能的信息点挖掘、模式识别以及证据表达方式三方面充分利用规则表示概念之间的关系,建立不确定性人工智能分析电子数据的认知模型,并用拓扑势形式化地表示电子数据信息中的规律性,这样才能确保不确定性人工智能电子数据证据分析过程的科学性。 展开更多
关键词 确定性人工智能电子数据 证据可信性 证据分析过程
下载PDF
网络攻击下不确定多智能体动态事件触发一致性
10
作者 陈侠 李露 《电光与控制》 CSCD 北大核心 2022年第12期7-12,共6页
研究了网络攻击下具有不确定性多智能体系统动态事件触发一致性问题。传统的事件触发机制无法通过改变触发规则来有效地节约网络资源。通过引入动态事件触发机制,利用该机制的动态变量使设计的事件触发条件可以根据系统的运行状态进行... 研究了网络攻击下具有不确定性多智能体系统动态事件触发一致性问题。传统的事件触发机制无法通过改变触发规则来有效地节约网络资源。通过引入动态事件触发机制,利用该机制的动态变量使设计的事件触发条件可以根据系统的运行状态进行动态调整,从而降低控制更新的频率。在时延控制输入、网络攻击及动态事件触发下,建立了闭环控制系统的数学模型。根据Lyapunov稳定性理论和线性矩阵不等式理论,证明了动态事件触发控制下多智能体系统的一致性。最后,通过仿真验证了该方法的可行性和有效性。 展开更多
关键词 网络攻击 确定智能 动态事件触发机制 一致性
下载PDF
基于创新应用驱动的不确定性人工智能教学新进展
11
作者 吴振宇 祝智敏 《信息与电脑》 2020年第17期225-227,共3页
培养人工智能领域人才是推动我国人工智能技术发展的重要动力,然而在人工智能教学中存在理论性强、内容难于理解等问题,导致学生对知识点的理解不清晰、掌握不牢。基于此,笔者总结了《不确定性人工智能》课程教学过程中的经验,并介绍了... 培养人工智能领域人才是推动我国人工智能技术发展的重要动力,然而在人工智能教学中存在理论性强、内容难于理解等问题,导致学生对知识点的理解不清晰、掌握不牢。基于此,笔者总结了《不确定性人工智能》课程教学过程中的经验,并介绍了如何通过创新应用的方法提升学生的思考与实践能力,希望能够为相关研究提供借鉴。 展开更多
关键词 确定性人工智能 创新应用 人工智能教学
下载PDF
考虑多主体主动行为的综合能源系统智能运行优化方法
12
作者 陈晓芳 尹华杰 +2 位作者 曾君 廖丁丁 刘俊峰 《电网技术》 EI CSCD 北大核心 2023年第10期4219-4228,共10页
综合能源系统具有主体多样性、逐利性、源荷不确定性及变量高维等特点,给综合能源系统运行优化带来巨大挑战。文章提出考虑多主体主动行为的综合能源系统智能运行优化方法。首先引入负荷聚合商统一管理用户可控负荷和储能资源,根据不同... 综合能源系统具有主体多样性、逐利性、源荷不确定性及变量高维等特点,给综合能源系统运行优化带来巨大挑战。文章提出考虑多主体主动行为的综合能源系统智能运行优化方法。首先引入负荷聚合商统一管理用户可控负荷和储能资源,根据不同主体特点,构建具有综合能源服务商、电负荷聚合商、热负荷聚合商的三智能体群综合能源系统。然后以综合能源系统日综合运行成本最小为优化目标,考虑多主体的主动行为,基于多智能体双延时深度确定性策略梯度强化学习算法(multi-agent twin delayed deep deterministic policy gradient,MATD3)建立分布式优化调度模型。最后仿真结果表明基于MATD3的多主体综合能源系统模型收敛速度快,训练稳定。相比于传统优化方法提高了决策速度,降低了系统运行成本,且表现出更强的环境自适应力。 展开更多
关键词 综合能源系统 多主体 负荷聚合商 主动行为 智能体双延时深度确定性策略梯度
下载PDF
不确定性与自然计算并行性的内在关联 被引量:3
13
作者 王鹏 李建平 《计算机科学》 CSCD 北大核心 2010年第2期216-220,共5页
不确定性是量子力学中已获得证明的自然界基本规律。通过分析自然算法中的并行性与不确定性的内在关联认为,不确定性不但是并行性产生的根源,还是算法智能产生的根源。根据这一认识给出了算法的不确定性原理,并结合Shannon的信息熵原理... 不确定性是量子力学中已获得证明的自然界基本规律。通过分析自然算法中的并行性与不确定性的内在关联认为,不确定性不但是并行性产生的根源,还是算法智能产生的根源。根据这一认识给出了算法的不确定性原理,并结合Shannon的信息熵原理建立了自然计算的不确定性智能模型(UIM)。这一模型认为先验知识信息和由不确定性所提供的信息共同构成了智能系统的基本模型。智能系统本质上就是一个信息系统,先验知识信息保证算法按正确的方向进行搜索,不确定性所提供的信息实现了算法对解空间的并行搜索,通过提高系统信息的含量将有效提高系统的智能水平。这一模型在Pi值的计算算法中也得到了印证。 展开更多
关键词 确定 自然计算 并行 智能 信息熵 确定智能模型
下载PDF
基于多智能体深度强化学习的电热联合系统优化运行 被引量:17
14
作者 董雷 刘雨 +3 位作者 乔骥 王新迎 王春斐 蒲天骄 《电网技术》 EI CSCD 北大核心 2021年第12期4729-4737,共9页
电热联合系统优化调度问题对于实现系统的能源互补、经济运行具有重要意义。电热联合系统优化运行涉及非线性、非凸、多目标问题求解,传统方法在计算实时性与迭代收敛性等方面存在困难。文章首先构建电热联合系统优化数学模型,将电热联... 电热联合系统优化调度问题对于实现系统的能源互补、经济运行具有重要意义。电热联合系统优化运行涉及非线性、非凸、多目标问题求解,传统方法在计算实时性与迭代收敛性等方面存在困难。文章首先构建电热联合系统优化数学模型,将电热联合系统按照不同利益主体划分为多智能体,基于多智能体深度确定性策略梯度强化学习算法,建立了适用于电热联合系统的行动器-评判器框架,将优化模型转化为强化学习模型。其次对智能体进行了状态与动作空间的划分,搭建多智能体强化学习环境并设计相应的奖励函数。最后进行电热联合系统算例验证,表明所提方法可以有效解决电热联合系统优化问题。训练后的多智能体强化学习模型可实时生成优化策略,克服传统方法运算时间长、难以满足在线计算要求的问题;和单智能体算法相比,模型训练过程更易稳定收敛,执行过程中各智能体仅依赖局部信息完成计算,解决不同利益主体的数据共享问题。 展开更多
关键词 电热联合系统 优化调度 智能体深度确定性策略梯度算法 深度强化学习
下载PDF
网络时代人工智能研究与发展 被引量:46
15
作者 李德毅 《智能系统学报》 2009年第1期1-6,共6页
50多年来,人工智能在模式识别、知识工程、机器人等领域已经取得重大成就,但是离真正的人类智能还相差甚远.当今网络时代,人工智能科学要在学科交叉研究中实现人工智能的发展与创新,会更加关注认知科学、脑科学、生物智能、物理学、网... 50多年来,人工智能在模式识别、知识工程、机器人等领域已经取得重大成就,但是离真正的人类智能还相差甚远.当今网络时代,人工智能科学要在学科交叉研究中实现人工智能的发展与创新,会更加关注认知科学、脑科学、生物智能、物理学、网络科学、计算机科学与人工智能之间的交叉渗透,重视认知物理学的研究;自然语言是人工智能研究知识表示无法回避的直接对象,要对语言中的概念建立起能够定量表示的不确定性转换模型,发展不确定性人工智能;要利用现实生活中复杂网络的小世界模型和无标度特性,把网络拓扑作为知识表示的一种新方法,研究网络拓扑的演化与网络动力学行为,研究网络智能.对这3个重要方向进行了阐述,并提出了具体建议. 展开更多
关键词 网络时代 人工智能 确定性人工智能 网络智能
下载PDF
网络时代的人工智能 被引量:16
16
作者 李德毅 肖俐平 《中文信息学报》 CSCD 北大核心 2008年第2期3-9,共7页
五十多年来,人工智能在模式识别、知识工程、机器人等领域已经取得重大成就,但是离真正的人类智能还相差甚远。本文强调在当今的网络时代,作为信息技术的先导,人工智能科学有着非常值得关注的研究方向,要在学科交叉研究中实现人工智能... 五十多年来,人工智能在模式识别、知识工程、机器人等领域已经取得重大成就,但是离真正的人类智能还相差甚远。本文强调在当今的网络时代,作为信息技术的先导,人工智能科学有着非常值得关注的研究方向,要在学科交叉研究中实现人工智能的发展与创新。要关注认知科学、脑科学、生物智能、物理学、复杂网络、计算机科学与人工智能之间的交叉渗透,尤其是重视认知物理学的研究;自然语言是人类思维活动的载体,是人工智能研究知识表示无法回避的直接对象,要对语言中的概念建立起能够定量表示的不确定性转换模型,发展不确定性人工智能;要利用现实生活中复杂网络的小世界模型和无尺度特性,把网络拓扑作为知识表示的一种新方法,研究网络拓扑的演化与网络动力学行为,研究网络化了的智能,从而适应信息时代数据挖掘的普遍要求,迎接人工智能科学与应用新的辉煌。 展开更多
关键词 人工智能 确定性人工智能 认知物理学 数据场 云模型 网络化智能
下载PDF
基于双层无人机网络的节能计算研究
17
作者 李盼 黄军锋 +1 位作者 樊韩文 马忠贵 《北方工业大学学报》 2024年第1期20-28,共9页
本文提出一种双层无人机辅助计算和供能系统,该系统将移动边缘计算(Mobile Edge Computing,MEC)的基站迁移至低层无人机上为地面用户设备提供服务,而高层无人机利用太阳能和激光充电技术,在保障自身续航的同时为低层无人机补充能量。同... 本文提出一种双层无人机辅助计算和供能系统,该系统将移动边缘计算(Mobile Edge Computing,MEC)的基站迁移至低层无人机上为地面用户设备提供服务,而高层无人机利用太阳能和激光充电技术,在保障自身续航的同时为低层无人机补充能量。同时联合优化双层无人机飞行轨迹、用户设备卸载决策及低层无人机充电决策,以最小化双层无人机与用户设备能耗。参考多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)算法,设计了一种改进的双层MADDPG算法对问题进行求解。仿真结果表明,该算法可以有效地降低双层无人机剩余能量的衰减速率,从而间接地提升无人机的续航时间。 展开更多
关键词 无人机 节能计算 太阳能 智能体深度确定性策略梯度(MADDPG) 激光充电
下载PDF
大数据时代下网络群体智能研究方法 被引量:9
18
作者 王华 赵东杰 +3 位作者 杨海涛 赵洪利 李智 李申龙 《计算机与现代化》 2015年第2期1-6,共6页
首先,对大数据时代下大众广泛深度交互的互联网环境进行了分析;其次,提出并释义了网络群体智能,指出网络群体智能具有"网络数据驱动,交互形式复杂,网络效应强大,知识生产为主,不确定性认知"等特性;然后,提出网络群体智能研究... 首先,对大数据时代下大众广泛深度交互的互联网环境进行了分析;其次,提出并释义了网络群体智能,指出网络群体智能具有"网络数据驱动,交互形式复杂,网络效应强大,知识生产为主,不确定性认知"等特性;然后,提出网络群体智能研究方法,该研究方法以复杂性科学方法论为指导,坚持融贯论,以复杂性科学、网络化数据挖掘和不确定性人工智能为支撑理论方法,突出网络群体智能特色和多学科交叉融合研究,采用系统分析、建模分析和仿真分析相结合技术途径从结构和动力学视角对网络群体智能科学问题进行多尺度多层次研究,解决网络群体智能研究理论方法不足的问题,深化了对网络群体智能和社会计算的认识。 展开更多
关键词 大数据 互联网 网络群体智能 复杂性科学 网络化数据挖掘 确定性人工智能
下载PDF
LEO-RAN切片场景联合用户关联和动态资源分配算法
19
作者 陈赓 邢治薇 +1 位作者 沈斐 曾庆田 《通信学报》 EI CSCD 北大核心 2024年第2期173-187,共15页
为了解决6G天地一体化网络的资源高效利用问题,提出了一种面向高密度低地球轨道卫星-无线接入网(LEO-RAN)切片场景的联合用户关联和动态资源分配算法。考虑不同切片的最小速率、最大时延及资源比例等约束,以频谱效率(SE)和不同切片服务... 为了解决6G天地一体化网络的资源高效利用问题,提出了一种面向高密度低地球轨道卫星-无线接入网(LEO-RAN)切片场景的联合用户关联和动态资源分配算法。考虑不同切片的最小速率、最大时延及资源比例等约束,以频谱效率(SE)和不同切片服务水平协议(SLA)满意率(SSR)的加权和作为优化目标,建立用户关联和资源分配的联合优化问题。首先设计基于多智能体深度确定性策略梯度(MADDPG)的网络切片算法确定切片资源比例,然后采用基于拉格朗日对偶的用户关联算法确定最优的用户关联策略,最后通过轮询调度机制将资源分配给用户。仿真结果表明,所提算法在满足不同切片差异化SLA的同时能够有效提高SE。与基于MADDPG-RA、MATD3-LG、MATD3-RA、MASAC-LG和MASAC-RA算法相比,所提算法系统效用分别提升了2.0%、2.3%、5.7%、8.7%和9.4%。 展开更多
关键词 LEO卫星通信 网络切片 用户关联 智能体深度确定性策略梯度 系统效用
下载PDF
混合动作空间下的多设备边缘计算卸载方法
20
作者 张冀 齐国梁 +1 位作者 朵春红 龚雯雯 《计算机工程与应用》 CSCD 北大核心 2024年第10期301-310,共10页
为降低多设备多边缘服务器场景中设备层级的总成本,并解决现有深度强化学习(deep reinforcement learning,DRL)只支持单一动作空间的算法局限性,提出基于混合决策的多智能体深度确定性策略梯度方法(hybrid-based multi-agent deep deter... 为降低多设备多边缘服务器场景中设备层级的总成本,并解决现有深度强化学习(deep reinforcement learning,DRL)只支持单一动作空间的算法局限性,提出基于混合决策的多智能体深度确定性策略梯度方法(hybrid-based multi-agent deep determination policy gradient,H-MADDPG)。首先考虑物联网设备/服务器计算能力随负载的动态变化、时变的无线传输信道增益、能量收集的未知性、任务量不确定性多种复杂的环境条件,建立MEC系统模型;其次以一段连续时隙内综合时延、能耗的总成本最小作为优化目标建立问题模型;最后将问题以马尔科夫决策过程(Markov decision procession,MDP)的形式交付给H-MADDPG,在价值网络的辅助下训练并行的两个策略网络,为设备输出离散的服务器选择及连续的任务卸载率。实验结果表明,H-MADDPG方法具有良好的收敛性和稳定性,从计算任务是否密集、延迟是否敏感等不同角度进行观察,H-MADDPG系统整体回报优于Local、OffLoad和DDPG,在计算密集型的任务需求下也能保持更大的系统吞吐量。 展开更多
关键词 物联网(IoT) 边缘计算卸载 智能体深度确定性策略梯度(MADDPG) 混合动作空间
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部