期刊文献+
共找到3,675篇文章
< 1 2 184 >
每页显示 20 50 100
Cu_(6)Sn_(5)纳米颗粒对SAC3005/Cu焊点形貌和性能的影响
1
作者 王彪 赵建华 +2 位作者 刘一澎 杨杰 严继康 《电子元件与材料》 CAS 北大核心 2024年第1期121-126,共6页
研究了添加Cu_(6)Sn_(5)纳米颗粒对SAC3005焊料焊点金属间化合物的形貌和性能的影响。采用湿化学法制备Cu_(6)Sn_(5)纳米颗粒,将Cu_(6)Sn_(5)纳米颗粒添加到SAC3005焊料中,经回流焊后,制备SAC3005-xCu_(6)Sn_(5)(x=0%,0.12%,0.18%,质量... 研究了添加Cu_(6)Sn_(5)纳米颗粒对SAC3005焊料焊点金属间化合物的形貌和性能的影响。采用湿化学法制备Cu_(6)Sn_(5)纳米颗粒,将Cu_(6)Sn_(5)纳米颗粒添加到SAC3005焊料中,经回流焊后,制备SAC3005-xCu_(6)Sn_(5)(x=0%,0.12%,0.18%,质量分数)复合焊点。采用金相显微镜对焊点的横断面进行观察,对焊点的横断面金属间化合物(IMCs)进行测量。采用ANSYS有限元软件对界面IMCs模型进行模拟,分析印刷电路板(PCB板)焊点失效机理。结果表明:添加Cu_(6)Sn_(5)纳米颗粒改性SAC3005/Cu焊点后的IMCs层厚度变薄。Cu_(6)Sn_(5)纳米颗粒的加入抑制了回流焊接过程中IMCs的生长,提高了焊点的可靠性。Cu_(6)Sn_(5)纳米颗粒的添加阻碍了Sn原子和Cu原子在界面处的扩散,抑制了Cu_(6)Sn_(5)IMCs的生长。添加质量分数为0.12%的Cu_(6)Sn_(5)纳米颗粒时抑制效果最好。焊点界面Cu_(6)Sn_(5)层和Cu_(3)Sn层是应力应变集中的地方,焊点交界处为焊点服役过程中的薄弱环节。 展开更多
关键词 Cu_(6)Sn_(5)纳米颗粒 sac3005焊料 金属间化合物 可靠性
下载PDF
基于路径模仿和SAC强化学习的机械臂路径规划算法 被引量:1
2
作者 宋紫阳 李军怀 +2 位作者 王怀军 苏鑫 于蕾 《计算机应用》 CSCD 北大核心 2024年第2期439-444,共6页
在机械臂路径规划算法的训练过程中,由于动作空间和状态空间巨大导致奖励稀疏,机械臂路径规划训练效率低,面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题,提出一种基于SAC(Soft Actor-Critic)强化学习的机械臂路径... 在机械臂路径规划算法的训练过程中,由于动作空间和状态空间巨大导致奖励稀疏,机械臂路径规划训练效率低,面对海量的状态数和动作数较难评估状态价值和动作价值。针对上述问题,提出一种基于SAC(Soft Actor-Critic)强化学习的机械臂路径规划算法。通过将示教路径融入奖励函数使机械臂在强化学习过程中对示教路径进行模仿以提高学习效率,并采用SAC算法使机械臂路径规划算法的训练更快、稳定性更好。基于所提算法和深度确定性策略梯度(DDPG)算法分别规划10条路径,所提算法和DDPG算法规划的路径与参考路径的平均距离分别是0.8 cm和1.9 cm。实验结果表明,路径模仿机制能提高训练效率,所提算法比DDPG算法能更好地探索环境,使得规划路径更加合理。 展开更多
关键词 模仿学习 强化学习 sac算法 路径规划 奖励函数
下载PDF
基于ASP-SAC算法的列车自动驾驶速度控制
3
作者 刘伯鸿 卢田 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第7期2637-2648,共12页
随着经济建设的绿色转型以及人工智能的快速发展,城市轨道交通已成为居民日常出行的重要方式,在保障安全性、高效性和准点性的前提下,列车运行的节能性和舒适性需求也越来越被关注。合理的运行策略能够有效实现多种目标需求下的列车自... 随着经济建设的绿色转型以及人工智能的快速发展,城市轨道交通已成为居民日常出行的重要方式,在保障安全性、高效性和准点性的前提下,列车运行的节能性和舒适性需求也越来越被关注。合理的运行策略能够有效实现多种目标需求下的列车自动驾驶速度控制,强化学习作为一种智能决策方法,能够有效解决这一控制问题。首先,通过综合分析技术、安全性和乘客体验等方面的因素,基于专家经验动作划分和状态信息熵将软演员-评论家(SAC)改进为动作状态经验优先软演员-评论家(ASP-SAC)方法,用于研究列车自动驾驶速度控制问题。其次,将问题马尔可夫形式化,搭建了列车运行环境,确定了状态空间、动作空间以及基于目标控制的奖励函数。最后,以北京地铁亦庄线的一段区间数据为例进行试验,对ASP-SAC方法进行验证并与其他一些算法在相同环境下进行性能优劣比较。研究结果表明:该方法对于多目标控制需求下的列车自动驾驶速度控制问题具有可行性,与未改进前相比算法效率提高22.73%,与PPO算法相比提高29.17%,改进效果良好。同时,列车运行时在安全性、舒适性无误的情况下,准时性、精确性和节能性都强于SAC、DQN、PPO以及PID算法,其中能耗分别减少3.64%、5.62%、4.38%、7.35%,控制效果良好。此外,该方法亦具备鲁棒性,在列车自动驾驶速度控制方面具有一定的优越性和可参考性。 展开更多
关键词 列车自动驾驶 多目标控制 强化学习 ASP-sac算法 速度控制
下载PDF
基于SACS的改造导管架平台地震响应分析
4
作者 刘桥林 徐化奎 +5 位作者 孙名丰 严谨 吴光林 林金波 毛鸿飞 卜永城 《船海工程》 北大核心 2024年第5期99-104,共6页
导管架平台改造后的受力特征发生变化,故须对拟改造平台地震响应进行重新评估,以确保平台运行安全。利用SACS软件,针对LD22-1 CEP导管架平台改造工程,考虑完整的甲板、导管架及立管等结构,并结合功率谱密度分析(PSD)方法,建立导管架平... 导管架平台改造后的受力特征发生变化,故须对拟改造平台地震响应进行重新评估,以确保平台运行安全。利用SACS软件,针对LD22-1 CEP导管架平台改造工程,考虑完整的甲板、导管架及立管等结构,并结合功率谱密度分析(PSD)方法,建立导管架平台地震响应三维有限元模型,通过数值模型计算分析导管架平台地震响应。改造后的LD22-1 CEP导管架平台4~6阶频率升高,最大升高值0.067,其他各阶频率均下降,最大下降值为0.103。相对应的平台4~6阶周期降低,最大降低值0.070,其他各阶周期均上升,最大升高值0.187。改造后平台杆件最大UC值较改造前提高了0.16,最大值为0.79,小于1.0;改造后节点最大UC值较改造前提高0.214,最大值为0.656,小于1.0;所有UC值均小于1.0,满足平台安全性要求。 展开更多
关键词 导管架平台 地震响应 sacS PSD
下载PDF
基于SAC的无人机自主导航方法研究
5
作者 寇凯 杨刚 +3 位作者 张文启 刘心成 姚远 周兴社 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第2期310-318,共9页
针对现有深度强化学习算法在无人机自主导航任务中面临环境局部可观且感知信息不足问题,基于非确定性策略SAC(soft actor-critic)强化学习算法对未知环境下的端到端无人机自主导航任务展开研究。具体而言,提出了一种基于记忆增强机制的... 针对现有深度强化学习算法在无人机自主导航任务中面临环境局部可观且感知信息不足问题,基于非确定性策略SAC(soft actor-critic)强化学习算法对未知环境下的端到端无人机自主导航任务展开研究。具体而言,提出了一种基于记忆增强机制的策略网络,通过对历史记忆信息与当前的观测整合处理,提取观测数据的时序依赖关系,从而增强局部可观条件下的状态估计能力,避免算法陷入局部最优解;设计了非稀疏奖励函数以缓解强化学习策略在稀疏奖励条件下难以收敛的问题;在Airsim+UE4仿真平台进行了多个复杂场景的训练验证。实验结果表明,所提方法导航成功率比基准算法提高10%,平均飞行距离缩短21%,有效增强了无人机自主导航算法稳定性和收敛性。 展开更多
关键词 强化学习 sac 无人机 自主导航
下载PDF
基于SACS的多级液压缸稳定性分析方法
6
作者 张新刚 侯敏 +3 位作者 白丙建 曹立天 邓荣 杨杰 《液压气动与密封》 2024年第4期31-36,共6页
为了提高钻机拆装效率并简化钻机起升系统结构,越来越多的钻机应用多级液压缸进行井架底座的起升/下放作业,整个作业过程中,液压缸受力情况复杂,理论分析时常将其简化为一根细长压杆,液压缸的安全可靠性关系着钻机起放作业的成败,必须... 为了提高钻机拆装效率并简化钻机起升系统结构,越来越多的钻机应用多级液压缸进行井架底座的起升/下放作业,整个作业过程中,液压缸受力情况复杂,理论分析时常将其简化为一根细长压杆,液压缸的安全可靠性关系着钻机起放作业的成败,必须分析校核其强度和稳定性,以确保其安全可靠性。以某出口钻机底座配套的起升用多级液压缸为例,介绍了一种基于SACS有限元分析软件的多级液压缸强度及稳定性分析校核方法。 展开更多
关键词 多级液压缸 强度 稳定性 sacS
下载PDF
基于SAC算法的含柔性负荷电-气互联系统的频率与气压协调控制策略
7
作者 张磊光 陈海涛 杨军 《智慧电力》 北大核心 2024年第4期8-14,共7页
现今,电燃气系统在维持微电网稳定、经济、灵活运行方面发挥着重要作用。当其受到电力与天然气负荷扰动时,控制器需要协调微电网频率和天然气管道节点的燃气压力。为此,提出1种基于柔性动作评价(SAC)算法的电-气互联系统的频率-气压协... 现今,电燃气系统在维持微电网稳定、经济、灵活运行方面发挥着重要作用。当其受到电力与天然气负荷扰动时,控制器需要协调微电网频率和天然气管道节点的燃气压力。为此,提出1种基于柔性动作评价(SAC)算法的电-气互联系统的频率-气压协调控制策略。首先,在分析天然气管网及耦合设备运行特性的基础上,建立天然气输送动态模型。其次,基于可控负荷用户行为的随机性,建立了包括微型燃气轮机(MT),电转气(P2G)设备、可控负荷、分布式电源和负荷的微电网负载频率控制模型。此外,根据微电网频率与气压2个控制目标,设计了控制器的结构。最后,设置不同工况进行仿真,结果表明所提策略能协调系统的频率与气压。 展开更多
关键词 频率控制 微电网 电气耦合系统 sac算法 柔性负荷
下载PDF
稳定且受限的新强化学习SAC算法
8
作者 海日 张兴亮 +1 位作者 姜源 杨永健 《吉林大学学报(信息科学版)》 CAS 2024年第2期318-325,共8页
为解决由于固定温度SAC(Soft Actor Critic)算法中存在的Q函数高估可能会导致算法陷入局部最优的问题,通过深入分析提出了一个稳定且受限的SAC算法(SCSAC:Stable Constrained Soft Actor Critic)。该算法通过改进最大熵目标函数修复固... 为解决由于固定温度SAC(Soft Actor Critic)算法中存在的Q函数高估可能会导致算法陷入局部最优的问题,通过深入分析提出了一个稳定且受限的SAC算法(SCSAC:Stable Constrained Soft Actor Critic)。该算法通过改进最大熵目标函数修复固定温度SAC算法中的Q函数高估问题,同时增强算法在测试过程中稳定性的效果。最后,在4个OpenAI Gym Mujoco环境下对SCSAC算法进行了验证,实验结果表明,稳定且受限的SAC算法相比固定温度SAC算法可以有效减小Q函数高估出现的次数并能在测试中获得更加稳定的结果。 展开更多
关键词 强化学习 最大熵强化学习 Q值高估 sac算法
下载PDF
融合注意力机制与SAC算法的虚拟电厂多能流低碳调度
9
作者 俞晓荣 徐青山 +1 位作者 杜璞良 王冬 《电力工程技术》 北大核心 2024年第5期233-246,共14页
虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难... 虚拟电厂(virtual power plant,VPP)作为多能流互联的综合能源网络,已成为中国加速实现双碳目标的重要角色。但VPP内部资源协同低碳调度面临多能流的耦合程度紧密、传统碳交易模型参数主观性强、含高维动态参数的优化目标在线求解困难等问题。针对这些问题,文中提出一种融合注意力机制(attention mechanism,AM)与柔性动作评价(soft actor-critic,SAC)算法的VPP多能流低碳调度方法。首先,根据VPP的随机碳流特性,面向动态参数建立基于贝叶斯优化的改进阶梯型碳交易机制。接着,以经济效益和碳排放量为目标函数构建含氢VPP多能流解耦模型。然后,考虑到该模型具有高维非线性与权重参数实时更新的特征,利用融合AM的改进SAC深度强化学习算法在连续动作空间对模型进行求解。最后,对多能流调度结果进行仿真分析和对比实验,验证了文中方法的可行性及其相较于原SAC算法较高的决策准确性。 展开更多
关键词 虚拟电厂(VPP) 多能流 改进碳交易机制 深度强化学习 注意力机制(AM) 柔性动作评价(sac)算法
下载PDF
对抗条件下基于SAC-Lagrangian的UAV智能规划
10
作者 岳龙飞 杨任农 +4 位作者 闫孟达 赵小茹 左家亮 刘会亮 张明元 《电光与控制》 CSCD 北大核心 2024年第8期1-7,共7页
无人机因其低成本、可消耗、分布部署、敏捷灵活的优势,在多个民用领域大放异彩。但受其智能化程度限制,如何在复杂对抗条件下自主安全完成任务仍存在巨大挑战。针对目前无人机任务规划存在的智能性和安全性问题,提出一种基于安全强化... 无人机因其低成本、可消耗、分布部署、敏捷灵活的优势,在多个民用领域大放异彩。但受其智能化程度限制,如何在复杂对抗条件下自主安全完成任务仍存在巨大挑战。针对目前无人机任务规划存在的智能性和安全性问题,提出一种基于安全强化学习算法的无人机智能规划方法(SAC-Lagrangian)。考虑了雷达威胁、禁飞区安全约束和地导对抗条件,将任务规划问题建模为约束马尔可夫决策过程(CMDP),通过拉格朗日乘子法变为对偶问题,采用最大熵柔性行动者-评论家(SAC)算法近似求解最优策略,保证了智能体在遵守安全约束条件下最大化期望回报。仿真结果表明,与其他基线算法相比,所提方法能在保证任务性能的同时确保安全性,适应动态变化的场景,任务完成率达到96%,因此,具有高效、鲁棒和安全的优势。 展开更多
关键词 无人机 安全强化学习 sac-Lagrangian 智能任务规划 鲁棒性
下载PDF
基于SACS甲板片龙门吊吊装研究
11
作者 于淼 张刚 +2 位作者 赵特 程庭信 宋玮 《石油和化工设备》 CAS 2024年第4期175-179,共5页
SACS是用于海洋平台以及一般陆地结构工程设计的结构有限元分析软件系统,已经发展成为当今海事结构设计分析中最广泛的软件系统。海洋工程中模块分层建造,大部分甲板片为正造,随着智能化焊接设备的问世,甲板片反造能大幅提高甲板片施工... SACS是用于海洋平台以及一般陆地结构工程设计的结构有限元分析软件系统,已经发展成为当今海事结构设计分析中最广泛的软件系统。海洋工程中模块分层建造,大部分甲板片为正造,随着智能化焊接设备的问世,甲板片反造能大幅提高甲板片施工效率,节约成本。随之而来的反造需要进行翻身作业,翻身作业危险系数大,必须进行翻身计算,进行受力分析。同时龙门吊翻身对比履带吊有先天的优势,能更好的降低吊装风险。本文就某一甲板片在建造后进行翻身计算分析为例,简述计算过程。并以在龙门吊作为吊装工具背景下,简单介绍方案全过程,从建立模型,受力计算,吊点布置,以及临时支撑,翻身步骤等简单阐述SACS软件在此领域的应用。 展开更多
关键词 sacS翻身 吊装 结构设计
下载PDF
基于SAC算法的多源信息融合机械臂控制方法
12
作者 权双璐 郭艳婕 +4 位作者 费逢宇 瑜熙敬 宋小云 辛顺恒 王超 《自动化应用》 2024年第5期52-54,共3页
融合多源传感器信息可实现机械臂的精准控制。提出了一种基于深度强化学习的多源信息融合控制方法,设计并搭建了可实现多源信息融合的机械臂控制实验平台,融合视觉、触觉、编码器3种模态信息,并选取学习效率较高的SAC算法实现机械臂自... 融合多源传感器信息可实现机械臂的精准控制。提出了一种基于深度强化学习的多源信息融合控制方法,设计并搭建了可实现多源信息融合的机械臂控制实验平台,融合视觉、触觉、编码器3种模态信息,并选取学习效率较高的SAC算法实现机械臂自主精准控制。在实验平台上,开展了3个由易到难的机械臂运动控制任务,以验证所提多源信息融合机械臂控制方案的有效性。 展开更多
关键词 机械臂 多源信息融合 深度强化学习 sac算法
下载PDF
利用MPI实现点云SAC-IA并行配准
13
作者 崔家武 曾波 +2 位作者 李海军 甄兆聪 梁建青 《工程勘察》 2024年第4期61-67,共7页
采样一致性初始配准算法(SAC-IA)是点云的一种粗配准算法。针对大规模点云SAC-IA配准效率低、实时性差等问题,本文提出利用消息传递接口MPI实现点云SAC-IA多进程并行配准,主要包括法向量并行估计、SPFH特征及FPFH特征并行计算和SAC-IA... 采样一致性初始配准算法(SAC-IA)是点云的一种粗配准算法。针对大规模点云SAC-IA配准效率低、实时性差等问题,本文提出利用消息传递接口MPI实现点云SAC-IA多进程并行配准,主要包括法向量并行估计、SPFH特征及FPFH特征并行计算和SAC-IA并行配准。实验结果表明,MPI多进程并行算法可显著提高点云SAC-IA配准速度。 展开更多
关键词 sac-IA MPI 法向量 SPFH特征 FPFH特征
下载PDF
基于SAC的炼厂原油储运调度方法
14
作者 马楠 李洪奇 +1 位作者 刘华林 杨磊 《化工进展》 EI CAS CSCD 北大核心 2024年第3期1167-1177,共11页
目前对于炼厂原油储运调度决策的研究大多采用基于数学规划的静态调度方案,求解时间较长并且无法针对环境的变化进行实时高效的储运调度优化。为此,本文结合深度强化学习算法建立了考虑炼厂生产约束的原油资源储运动态实时调度决策算法... 目前对于炼厂原油储运调度决策的研究大多采用基于数学规划的静态调度方案,求解时间较长并且无法针对环境的变化进行实时高效的储运调度优化。为此,本文结合深度强化学习算法建立了考虑炼厂生产约束的原油资源储运动态实时调度决策算法。该算法首先将炼厂原油资源调度问题转换为马尔可夫决策过程,其次提出了一种基于软演员-评论家(soft actor-critic,SAC)的深度强化学习算法来同时确定调度过程中的传输目标等离散决策以及传输速度等连续决策。结果表明,算法学习到的策略可行性较好,与基线算法相比,油轮在港时间、调度方案事件数量、加工计划执行率等重要指标方面均得到了较好的效果,在求解时间方面大幅提升至毫秒级,并有效控制随机事件对整体决策的影响范围。该算法可为沿海炼厂原油储运调度快速决策提供新的思路。 展开更多
关键词 炼厂原油储运 资源调度 深度强化学习 软演员-评论家
下载PDF
基于SACS软件海上升压站节点分析
15
作者 陈长兵 王艳强 +1 位作者 刘昌斌 李旭 《中国科技期刊数据库 工业A》 2024年第2期0082-0086,共5页
本文采用SACS软件,对某海上升压站钢结构连接节点进行应力分析,计算时采用壳单元模拟钢板,采用杆单元模拟梁柱,采用弹性本构关系,进行弹性计算分析,并通过对比分析ANSYS及ABAQUS通用有限元软件的计算结果,验证了采用SACS软件计算连接节... 本文采用SACS软件,对某海上升压站钢结构连接节点进行应力分析,计算时采用壳单元模拟钢板,采用杆单元模拟梁柱,采用弹性本构关系,进行弹性计算分析,并通过对比分析ANSYS及ABAQUS通用有限元软件的计算结果,验证了采用SACS软件计算连接节点的安全性与可行性,可为后续类似工程节点分析和设计提供参考。 展开更多
关键词 sacS 有限元 连接节点 应力分析
下载PDF
固态热迁移下Cu/SAC305/Cu微焊点界面IMCs微观形貌演变研究
16
作者 杨廓 李五岳 +2 位作者 李爽 闫志成 田野 《河南科技》 2024年第8期40-43,共4页
【目的】研究固态热迁移条件下Cu/SAC305/Cu微焊点中金属间化合物(IMCs,Intermetallic Compounds)微观形貌演变与非均匀化生长规律。【方法】使用回流焊机制备微焊点,并利用固态热迁移平台开展热迁移试验。【结果】随着热迁移时间的延长... 【目的】研究固态热迁移条件下Cu/SAC305/Cu微焊点中金属间化合物(IMCs,Intermetallic Compounds)微观形貌演变与非均匀化生长规律。【方法】使用回流焊机制备微焊点,并利用固态热迁移平台开展热迁移试验。【结果】随着热迁移时间的延长,在冷端Cu与Cu6Sn5界面处产生Cu3Sn新相,界面IMCs总厚度增加,形貌由均匀分布的扇贝状转化为层状,微焊点界面存在冷端IMCs增长显著快于热端的非均匀化生长现象。【结论】研究了Cu/SAC305/Cu微焊点服役过程中微观形貌演变规律,为可靠性评估提供一定的参考。 展开更多
关键词 Cu/sac305/Cu微焊点 固态热迁移 非均匀化生长
下载PDF
Twin fetuses associated with double amniotic sacs diagnosed using transvaginal ultrasonography:A case report
17
作者 Zheng-Qiao Liang Wen-Qing Ding 《World Journal of Clinical Cases》 SCIE 2024年第18期3534-3538,共5页
BACKGROUND Conjoined twins are a rare twin malformation commonly presenting as single amniotic sac twinning,with double amniotic sac twinning being extremely rare and poorly reported.Most conjoined twins are females.C... BACKGROUND Conjoined twins are a rare twin malformation commonly presenting as single amniotic sac twinning,with double amniotic sac twinning being extremely rare and poorly reported.Most conjoined twins are females.CASE SUMMARY A woman of childbearing age conceived naturally,and at 8 wk of gestation,transvaginal ultrasonography showed an embryo and cardiac tube pulsation in both amniotic sacs.On dynamic observation,the two embryos were connected in the lower abdomen,with restricted movement.A repeat transvaginal ultrasound at 11 wk showed that the intestinal tubes of both fetuses were connected in the lower abdomen.The pregnancy was terminated and labor was induced.CONCLUSION Transvaginal ultrasound may detect conjoined twin malformations in an early stage.Our case provides diagnostic insights for ultrasonographers and can help develop early therapeutic interventions. 展开更多
关键词 Double amniotic sac Conjoined twins Yolk sac Transvaginal ultrasound Case report
下载PDF
基于改进SAC算法的机械臂运动规划
18
作者 唐超 张帆 《电子科技》 2024年第11期47-54,共8页
针对深度强化学习算法在高维状态空间和高精度需求下的机械臂运动规划任务中存在探索效率低、收敛速度慢以及不收敛等问题,文中以SAC(Soft Actor-Critic)算法为基础,引入异步优势机制,提出了一种融合异步优势的AA-SAC(Asynchronous Adva... 针对深度强化学习算法在高维状态空间和高精度需求下的机械臂运动规划任务中存在探索效率低、收敛速度慢以及不收敛等问题,文中以SAC(Soft Actor-Critic)算法为基础,引入异步优势机制,提出了一种融合异步优势的AA-SAC(Asynchronous Advantage Soft Actor-Critic)算法。该算法使用Q target网络代替了原V网络,有效降低了Q网络的方差,n个独立的进程可并行训练,提升了训练效率。将AA-SAC算法的经验回放池划分成两个部分,将高质量的经验数据单独存放、单独采样,以提高有效经验数据的利用率。仿真结果表明,AA-SAC算法在收敛速度、成功率和稳定性上表现最优。相较于SAC算法,AA-SAC算法的收敛时间提前了3000回合。收敛后AA-SAC算法的成功率达到了96%,比SAC算法提升了6%,比DDPG(Deep Deterministic Policy Gradient)算法提升了26%。 展开更多
关键词 深度强化学习 异步优势 sac算法 经验回放池 机械臂 运动规划 微创手术 CoppeliaSim
下载PDF
Task Offloading and Trajectory Optimization in UAV Networks:A Deep Reinforcement Learning Method Based on SAC and A-Star
19
作者 Jianhua Liu Peng Xie +1 位作者 Jiajia Liu Xiaoguang Tu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第11期1243-1273,共31页
In mobile edge computing,unmanned aerial vehicles(UAVs)equipped with computing servers have emerged as a promising solution due to their exceptional attributes of high mobility,flexibility,rapid deployment,and terrain... In mobile edge computing,unmanned aerial vehicles(UAVs)equipped with computing servers have emerged as a promising solution due to their exceptional attributes of high mobility,flexibility,rapid deployment,and terrain agnosticism.These attributes enable UAVs to reach designated areas,thereby addressing temporary computing swiftly in scenarios where ground-based servers are overloaded or unavailable.However,the inherent broadcast nature of line-of-sight transmission methods employed by UAVs renders them vulnerable to eavesdropping attacks.Meanwhile,there are often obstacles that affect flight safety in real UAV operation areas,and collisions between UAVs may also occur.To solve these problems,we propose an innovative A*SAC deep reinforcement learning algorithm,which seamlessly integrates the benefits of Soft Actor-Critic(SAC)and A*(A-Star)algorithms.This algorithm jointly optimizes the hovering position and task offloading proportion of the UAV through a task offloading function.Furthermore,our algorithm incorporates a path-planning function that identifies the most energy-efficient route for the UAV to reach its optimal hovering point.This approach not only reduces the flight energy consumption of the UAV but also lowers overall energy consumption,thereby optimizing system-level energy efficiency.Extensive simulation results demonstrate that,compared to other algorithms,our approach achieves superior system benefits.Specifically,it exhibits an average improvement of 13.18%in terms of different computing task sizes,25.61%higher on average in terms of the power of electromagnetic wave interference intrusion into UAVs emitted by different auxiliary UAVs,and 35.78%higher on average in terms of the maximum computing frequency of different auxiliary UAVs.As for path planning,the simulation results indicate that our algorithm is capable of determining the optimal collision-avoidance path for each auxiliary UAV,enabling them to safely reach their designated endpoints in diverse obstacle-ridden environments. 展开更多
关键词 Mobile edge computing sac communication security A-Star UAV
下载PDF
基于SAC算法的多交叉口交通信号控制研究 被引量:1
20
作者 钱立军 宣亮 +1 位作者 陈健 陈晨 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第1期105-111,共7页
针对深度Q网络(deep Q-learning network,DQN)算法在解决多交叉口交通信号配时方案由于外部环境变化和内部参数波动导致效果不佳的问题,提出了基于柔性“行动器-评判器”(soft actor-critic,SAC)的交叉口交通信号控制方法,并设计了相应... 针对深度Q网络(deep Q-learning network,DQN)算法在解决多交叉口交通信号配时方案由于外部环境变化和内部参数波动导致效果不佳的问题,提出了基于柔性“行动器-评判器”(soft actor-critic,SAC)的交叉口交通信号控制方法,并设计了相应的系统采样策略和回报函数.与原采样策略相比,新采样策略将相邻智能体的策略信息加入到系统状态中,使当前智能体能够得到更多的交叉口交通分布和合作策略信息.与原回报函数相比,新回报函数中引入空间折扣因子,缩小了相邻智能体的观察和回报值,使当前智能体更加关注和改善当前交通状况.随后在此基础上分别应用DQN和SAC算法设计交通信号控制方法.Webster配时法是利用相位流量数据开发的一种基于周期的固定相位长度交通信号方法,与DQN和SAC算法相比,其优化目标是降低交叉口延迟时间,不考虑交叉口排队长度.在城市交通模拟软件(simulation of urban mobility,SUMO)中构建一个时变交通流交通网络,并在其中分别对基于DQN、SAC和Webster配时法的信号配时控制方法进行仿真测试.仿真结果表明:基于SAC算法的交通信号控制方法与基于DQN算法和Webster配时法的交通信号控制方法相比,能够显著减少交叉口排队长度和平均延迟时间,具体来说,车辆平均排队长度分别减少了17.8%和28.2%,平均延迟分别减少了26.8%和36.3%,说明所提出的方法具有更好的控制效果. 展开更多
关键词 智能交通 交通信号控制 信号交叉口 深度Q网络 柔性“行动器-评判器”
下载PDF
上一页 1 2 184 下一页 到第
使用帮助 返回顶部