期刊文献+
共找到3,252篇文章
< 1 2 163 >
每页显示 20 50 100
不同预时效挤压态Mg−Gd−Y−Zn−Zr合金的再结晶行为和强化机制 被引量:1
1
作者 徐健 郑杰 +5 位作者 刘莞尔 黄有旺 闫钊鸣 张治民 王强 薛勇 《Transactions of Nonferrous Metals Society of China》 SCIE EI CAS CSCD 2024年第2期480-503,共24页
通过控制预时效时间制备3种不同状态的试样,研究不同预时效状态对挤压态Mg−9.5Gd−4Y−2.2Zn−0.5Zr(质量分数,%)合金的动态再结晶行为(DRX)和性能的影响。结果表明,欠时效挤压(UAE)样品的细晶体积分数为17.4%,而峰时效挤压(PAE)和过时效挤... 通过控制预时效时间制备3种不同状态的试样,研究不同预时效状态对挤压态Mg−9.5Gd−4Y−2.2Zn−0.5Zr(质量分数,%)合金的动态再结晶行为(DRX)和性能的影响。结果表明,欠时效挤压(UAE)样品的细晶体积分数为17.4%,而峰时效挤压(PAE)和过时效挤压(OAE)样品的细晶体积分数分别达到89.7%和50.4%。在晶粒内部和晶界处分布的致密、细小的β颗粒相通过粒子激发形核机制显著提高了形核位点和位错密度。然而,致密针状γ'相抑制位错滑移,延迟DRX形核。PEA和OAE样品中细小晶粒的差异归因于原始颗粒相的数量和尺寸的不同,而其拉伸性能的差异归因于不同的显微组织。由于晶界强化和析出强化机制的贡献更大,PAE样品具有更优异的拉伸性能。 展开更多
关键词 Mg−Gd−Y−Zn−Zr合金 预时效处理 再结晶行为 强化机制 粒子刺激形核
下载PDF
新型压力容器用钢25CrMo3NiTiVNbZr的析出相特征和强化机制 被引量:1
2
作者 李若浩 王中成 +2 位作者 梁恩溥 何肖飞 徐乐 《材料热处理学报》 CAS CSCD 北大核心 2024年第2期129-138,共10页
为了进一步提高25Cr3Mo3NiNbZr钢的室温力学性能,对其进行成分优化,设计制备了25CrMo3NiTiVNbZr钢。利用场发射扫描电镜(SEM)、透射电镜(TEM)、电子背散射衍射(EBSD)技术以及拉伸试验机等研究了两种试验钢经1050℃淬火及640℃回火2 h后... 为了进一步提高25Cr3Mo3NiNbZr钢的室温力学性能,对其进行成分优化,设计制备了25CrMo3NiTiVNbZr钢。利用场发射扫描电镜(SEM)、透射电镜(TEM)、电子背散射衍射(EBSD)技术以及拉伸试验机等研究了两种试验钢经1050℃淬火及640℃回火2 h后的室温力学性能、析出相特征和强化机理。结果表明:25Cr3Mo3NiNbZr钢主要析出相为纺锤状富Mo的M_(2)C相,其平均直径为18 nm,25CrMo3NiTiVNbZr钢中析出了更加细小的M_(2)C和MC碳化物,其平均直径为7.93 nm。25CrMo3NiTiVNbZr钢的室温抗拉强度达到1412 MPa,屈服强度达到1279 MPa,相比25Cr3Mo3NiNbZr钢分别提高了283和336 MPa。通过理论计算,两种试验钢室温下的强化机制均以析出强化、细晶强化和位错强化为主,其中25CrMo3NiTiVNbZr钢的位错强化增量和析出强化增量较25Cr3Mo3NiNbZr钢明显增加,分别增加了174和205 MPa。 展开更多
关键词 25CrMo3NiTiVNbZr钢 成分优化 强化机制 纳米析出相
下载PDF
羟基乙叉二膦酸对Fe^(2+)活化O_(2)降解污染物的强化效果及机制
3
作者 茹金涛 王德玉 +3 位作者 张成武 李媛 刘柯阳 秦传玉 《中国环境科学》 EI CAS CSCD 北大核心 2024年第6期3142-3150,共9页
羟基乙叉二膦酸(HEDP)常与Fe^(2+)形成Fe^(2+)-HEDP配合物,本文验证了HEDP存在可以促进Fe^(2+)活化分子氧产生活性自由基(ROS),研究结果显示添加2mmol/L HEDP后,Fe^(2+)/O_(2)体系中苯酚(10mg/L)的降解效果从0.69%提升到69.31%,在此过程... 羟基乙叉二膦酸(HEDP)常与Fe^(2+)形成Fe^(2+)-HEDP配合物,本文验证了HEDP存在可以促进Fe^(2+)活化分子氧产生活性自由基(ROS),研究结果显示添加2mmol/L HEDP后,Fe^(2+)/O_(2)体系中苯酚(10mg/L)的降解效果从0.69%提升到69.31%,在此过程中,体系中的HEDP还能够实现部分自降解.电子自旋共振(ESR)和掩蔽实验结果表明体系中主要ROS为HO^(•)和O_(2)^(•–),双电子传递途径(O_(2)→H_(2)O_(2)→HO^(•))是体系中产生HO^(•)的主要方式.在3.0~9.0的pH值范围内,HEDP都能够促进ROS的产生和污染物的降解,常见环境阴离子对体系影响较小. 展开更多
关键词 羟基乙叉二膦酸 二价铁 分子氧活化 高级氧化 强化机制
下载PDF
SiCp/Al-Si基复合材料界面结构调控及强化机制的研究进展
4
作者 苏嶓 王爱琴 +4 位作者 谢敬佩 刘瑛 张津浩 柳培 梁婷婷 《材料热处理学报》 CAS CSCD 北大核心 2024年第2期1-12,共12页
SiCp/Al-Si基复合材料具有高的比强度、比刚度、比模量,良好的导热、导电、耐磨性及尺寸稳定性等优点,作为结构功能性材料应用于空间工程、电子封装、交通运输和精密仪器等领域。其研究热点主要集中在界面结构调控、强化机制及性能调控... SiCp/Al-Si基复合材料具有高的比强度、比刚度、比模量,良好的导热、导电、耐磨性及尺寸稳定性等优点,作为结构功能性材料应用于空间工程、电子封装、交通运输和精密仪器等领域。其研究热点主要集中在界面结构调控、强化机制及性能调控等方面。在SiCp/Al-Si复合材料中存在着增强体与基体界面、析出相与基体界面、析出相与增强体界面,这些界面受各种因素影响,会出现多种界面反应和界面产物,界面结构和结合状态复杂而多样。基于此,本文综述了制备工艺、基体合金成分和SiCp表面改性等方面对SiCp/Al-Si基复合材料界面结构的影响及调控,并总结了影响其力学性能的因素及强化机制的研究现状,最后对复合材料未来的发展及研究方向进行了展望。 展开更多
关键词 SiCp/Al-Si复合材料 界面结构调控 力学性能 强化机制 多尺度研究
下载PDF
基于价值函数分解和通信学习机制的异构多智能体强化学习方法
5
作者 杜威 丁世飞 +2 位作者 郭丽丽 张健 丁玲 《计算机学报》 EI CAS CSCD 北大核心 2024年第6期1304-1322,共19页
许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习... 许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习的多智能体任务时表现不佳.同时,目前大多数通信机制都是针对同构多智能体环境设计的,没有考虑异构多智能体场景.在异构场景中,由于智能体动作空间或观测空间的异构性,智能体之间的信息共享并不直接.如果不能对智能体的异构性进行有效地建模处理,通信机制将变得无效,甚至会影响多智能体的协作性能.为了应对这些挑战,本文提出一个融合价值函数分解和通信学习机制的异构多智能体强化学习框架.具体地:(1)与采用同构图卷积网络的方法不同,该框架利用异构图卷积网络融合智能体的异构特征信息得到有效的嵌入;(2)利用通信学习模块获得的嵌入信息和局部观测历史计算每个智能体的动作价值,以选择和协调智能体的动作;(3)通过设计的互信息损失函数和价值函数分解模块的损失函数联合训练,能够有效地训练整个方法.本文首先在两个异构多智能体平台上进行实验,实验结果表明该方法能学到比基线方法更有效的策略,在两个平台上相比基线方法分别提高了 13%的平均奖励值和24%的平均胜率.此外,在交通信号控制场景中验证了该方法在现实系统中的可行性. 展开更多
关键词 价值函数分解 异构多智能体强化学习 通信机制 图神经网络 互信息 交通信号控制
下载PDF
水电高强钢强化机制与焊接性的研究进展
6
作者 范晨阳 包晔峰 +4 位作者 韦尚志 宋亓宁 许楠 杨可 蒋永峰 《电焊机》 2024年第2期89-97,共9页
水电用钢作为高转速、高效率、大容量水力发电机组的核心材料,其强化机制与焊接特性是当前研究的重点和热点。对近年来水电用钢的发展现状进行概述,深入分析其化学成分、组织性能及各种强化机制对强度的影响。研究发现,细晶强化、固溶... 水电用钢作为高转速、高效率、大容量水力发电机组的核心材料,其强化机制与焊接特性是当前研究的重点和热点。对近年来水电用钢的发展现状进行概述,深入分析其化学成分、组织性能及各种强化机制对强度的影响。研究发现,细晶强化、固溶强化、位错强化和第二相强化均能有效提高水电用钢的强度。同时,还详细探讨了水电高强钢焊接接头的裂纹倾向、焊缝金属与母材的强韧性匹配机制以及热影响区的性能变化等焊接性特点。这一研究不仅为水电用钢的性能优化提供了理论依据,也为相关领域的技术进步提供了有力支持。 展开更多
关键词 水电用高强钢 组织性能 强化机制 焊接性特点
下载PDF
基于因果机制约束的强化推荐系统
7
作者 张斯力 李梓健 +2 位作者 蔡瑞初 郝志峰 闫玉光 《计算机工程》 CAS CSCD 北大核心 2024年第5期279-290,共12页
利用历史数据训练强化学习推荐系统已经得到越来越多研究人员的关注,但是历史数据使得强化学习模型对状态-动作估值错误,产生数据偏差,如流行度偏差和选择偏差。造成上述问题的原因是历史数据分布与强化学习策略采集的数据分布不一致以... 利用历史数据训练强化学习推荐系统已经得到越来越多研究人员的关注,但是历史数据使得强化学习模型对状态-动作估值错误,产生数据偏差,如流行度偏差和选择偏差。造成上述问题的原因是历史数据分布与强化学习策略采集的数据分布不一致以及历史数据本身带有偏差。使用因果机制可以在约束策略采集数据分布的同时解决数据偏差的问题,提出基于因果机制约束的强化推荐系统,包含因果机制约束模块和对比策略模块。因果机制约束模块用于约束推荐策略可选择的样本空间以减少策略分布与数据分布误差,考虑随时间动态变化的物品流行度分布以缓解流行度偏差。对比策略模块通过平衡正负样本的重要性,缓解选择偏差的影响。在真实数据集Ciao和Epinions上的实验结果表明,相比深度Q网络(DQN)-r、GAIL、SOFA等,该算法具有较优的准确性和多样性,包含加入因果机制约束模块后的模型在F-measure指标上分别提高2%和3%,进一步验证了因果机制约束模块的有效性。 展开更多
关键词 推荐系统 强化学习 因果机制 外推误差 数据偏差
下载PDF
强化学习中的注意力机制研究综述
8
作者 夏庆锋 许可儿 +4 位作者 李明阳 胡凯 宋利鹏 宋志强 孙宁 《计算机科学与探索》 CSCD 北大核心 2024年第6期1457-1475,共19页
近年来,强化学习与注意力机制的结合在算法研究领域备受瞩目。在强化学习算法中,注意力机制的应用在提高算法性能方面发挥了重要作用。重点聚焦于注意力机制在深度强化学习中的发展,审视了其在多智能体强化学习领域的应用,并对相关研究... 近年来,强化学习与注意力机制的结合在算法研究领域备受瞩目。在强化学习算法中,注意力机制的应用在提高算法性能方面发挥了重要作用。重点聚焦于注意力机制在深度强化学习中的发展,审视了其在多智能体强化学习领域的应用,并对相关研究成果进行调研。首先,介绍了注意力机制和强化学习的研究背景与发展历程,并调研了该领域中的相关实验平台;然后,回顾了强化学习与注意力机制的经典算法,并从不同角度对注意力机制进行分类;接着,对注意力机制在强化学习领域的应用进行了梳理,根据三种任务类型(完全合作型、完全竞争型和混合合作竞争型)进行分类分析,重点关注了多智能体领域的应用情况;最后,总结了注意力机制对强化学习算法的改进作用,并展望了该领域所面临的挑战和未来的研究前景。 展开更多
关键词 强化学习 注意力机制 多智能体系统
下载PDF
考虑智能体前置状态及环境特征自适应机制的强化学习电网调度方法
9
作者 杨艳红 卢鑫 +3 位作者 张雷杰 周世威 裴玮 朱丹丹 《高电压技术》 EI CAS CSCD 北大核心 2024年第8期3497-3507,I0012,I0013,共13页
高比例可再生能源的接入使得电网潮流难以预测与控制,给电网的安全稳定运行带来了新的挑战。相较于传统的调度控制模式,以强化学习为代表的智能调度方式能够应对部分可观测电网环境下的顺序决策问题,但在电网中可再生能源比例发生变化... 高比例可再生能源的接入使得电网潮流难以预测与控制,给电网的安全稳定运行带来了新的挑战。相较于传统的调度控制模式,以强化学习为代表的智能调度方式能够应对部分可观测电网环境下的顺序决策问题,但在电网中可再生能源比例发生变化时易出现适应性较差的状况。针对该问题,以Actor-Critic为基础框架,采用前置状态表征智能体状态,并引入环境特征自适应机制,用于可再生能源比例变化场景的电网调度任务。由于调度动作后的电网状态受源荷波动等外源性随机事件影响,易引起状态空间爆炸问题,在潮流计算之前采用前置状态表征智能体状态,可有效缩减状态空间。引入环境特征的自适应机制可有效避免“决策遗忘”的问题,从而提高智能体对电网中可再生能源比例变化的适应性。仿真实验结果表明,在可再生能源比例动态变化的118节点电网调度任务中,该方法在收敛速度和控制稳定性等方面均表现优异。 展开更多
关键词 强化学习 A3C算法 前置状态 自适应机制 电网调度
下载PDF
HSn70-1锡黄铜冷源辅助搅拌摩擦焊搅拌区的强化机制和应变硬化行为
10
作者 许楠 张柏硕 +4 位作者 齐天祥 刘朝阳 徐玉缀 宋亓宁 包晔峰 《焊接学报》 EI CAS CSCD 北大核心 2024年第1期17-22,I0004,共7页
采用冷源辅助搅拌摩擦焊对2 mm厚的HSn70-1锡黄铜进行对接焊接,并获得了无缺陷的焊接接头.利用光学显微镜、电子背散射衍射、透射电子显微镜和拉伸试验,分析搅拌区的微观组织及其对强化机制和应变硬化行为的影响.结果表明,干冰乙醇混合... 采用冷源辅助搅拌摩擦焊对2 mm厚的HSn70-1锡黄铜进行对接焊接,并获得了无缺陷的焊接接头.利用光学显微镜、电子背散射衍射、透射电子显微镜和拉伸试验,分析搅拌区的微观组织及其对强化机制和应变硬化行为的影响.结果表明,干冰乙醇混合物的快速冷却作用不仅消除了热影响区,还抑制了搅拌区的位错回复和晶粒长大.搅拌区呈现具有较高位错密度的超细晶结构,搅拌区的抗拉强度为486 MPa,比母材提高了53.8%,断后伸长率也达到了30%,搅拌区屈服强度较母材提高了47.1%,其强化机制主要为固溶强化和晶界强化,但搅拌区的应变硬化行为主要受晶粒尺寸和位错密度的影响.由拉伸过程中产生的纳米尺度变形孪晶可协调塑性变形,并有效缓解应力集中,使搅拌区强度提高的同时仍具有良好的延展性. 展开更多
关键词 锡黄铜 搅拌摩擦焊 微观组织 强化机制 应变硬化行为
下载PDF
超声无铆静力学性能强化试验与机制研究
11
作者 赵伦 王世成 +5 位作者 许龙 李激光 霍小乐 郭子鑫 林森 曾照海 《应用声学》 CSCD 北大核心 2024年第2期443-449,共7页
无铆连接是一种薄板材料连接新技术,可在无需预成孔和表面预处理情况下,实现同种、异种、多层薄板材料高效连接,但由于无铆接头静力学性能较低,极大地限制了该连接技术的推广与发展。为解决该问题,该文选用5A06铝合金与TA1钛合金进行同... 无铆连接是一种薄板材料连接新技术,可在无需预成孔和表面预处理情况下,实现同种、异种、多层薄板材料高效连接,但由于无铆接头静力学性能较低,极大地限制了该连接技术的推广与发展。为解决该问题,该文选用5A06铝合金与TA1钛合金进行同种金属无铆铆接,并在此基础上进行了超声金属焊接复合试验,基于静拉伸测试和扫描电镜分析,探究超声焊对无铆接头力学性能的强化机制。试验结果表明:超声焊可有效提升无铆接头力学性能,特别是对于铝合金无铆接头;超声焊使得铝合金板接头部分塑性提高,钛合金接头部分则得到硬化;超声焊后无铆接头的受力形式发生改变,从颈部受力变为先焊合区受力再颈部受力,这是超声焊复合强化的根本原因;超声焊可使铝合金无铆接头内部形成一定深度的固相焊,使铝合金接头力学性能得到大幅提升;TA1钛合金无铆接头内部固相焊较浅,力学性能提升相对较低。 展开更多
关键词 超声金属焊 无铆连接 力学性能 微观组织 强化机制
下载PDF
植物-电动耦合修复重金属污染土的效能及其强化机制
12
作者 李敏 赵博华 +2 位作者 于禾苗 齐振霄 李辉 《土木与环境工程学报(中英文)》 CSCD 北大核心 2024年第5期26-37,共12页
重金属污染土壤的净化效果直接影响修复后土体的再利用。以Cd、Cu、Ni、Zn、Pb污染土壤为研究对象,采用改进环绕式电极布置,以植物-电动耦合修复下土壤的净化度及土壤性质为重点,厘清关键因素,揭示耦合强化修复机制。结果表明:植物-电... 重金属污染土壤的净化效果直接影响修复后土体的再利用。以Cd、Cu、Ni、Zn、Pb污染土壤为研究对象,采用改进环绕式电极布置,以植物-电动耦合修复下土壤的净化度及土壤性质为重点,厘清关键因素,揭示耦合强化修复机制。结果表明:植物-电动耦合修复下不同重金属的去除率均较单一修复有所提高,重金属赋存形态及植物对重金属的响应是影响修复效果的关键因素。改进环绕式电场的施加能积极调动更大范围土壤中的重金属向植物根系迁移聚集,解决了植物修复中重金属可及性和生物活性低的问题;植物修复的协助有利于改善电动修复对土壤性质的不利影响,解决聚焦效应和高能耗问题。植物-电动耦合修复联合了重金属的空间分布改善、重金属生物利用度提升、植物生长代谢强化及土壤微生物生命活动调节等作用机制,有效提高了重金属污染土壤的净化度,修复后土体可维持稳定的pH值(6.27~7.91)、电导率(108~159μs/cm)及低能耗(13.76~18.81 kW·h/m3),有助于推进污染土壤的可持续利用。 展开更多
关键词 土壤污染 净化修复 植物修复 电动修复 强化机制 重金属污染
下载PDF
传统式和断续式模拟移动床的内在强化机制研究 被引量:1
13
作者 张洪亮 李志雄 张璐 《辽宁化工》 CAS 2024年第2期307-312,共6页
断续式模拟移动床(ISMB)是在传统模拟移动床(SMB)的基础上将切换时间分为了若干段,这样就能有效将模拟移动床的4个区块物尽其用,降低溶剂消耗和提高产率。选择了3种不同性质的药物作为基础体系,并以多种双目标组合进行约束和限制。以多... 断续式模拟移动床(ISMB)是在传统模拟移动床(SMB)的基础上将切换时间分为了若干段,这样就能有效将模拟移动床的4个区块物尽其用,降低溶剂消耗和提高产率。选择了3种不同性质的药物作为基础体系,并以多种双目标组合进行约束和限制。以多目标优化得出的帕累托解集为基础,对比和分析不同机制的模拟移动床之间、不同性质的药物体系之间是否存在对分离表现的影响。 展开更多
关键词 断续式模拟移动床 强化机制 多目标优化
下载PDF
基于学习机制的多智能体强化学习综述
14
作者 王若男 董琦 《工程科学学报》 EI CSCD 北大核心 2024年第7期1251-1268,共18页
强化学习作为人工智能领域的重要分支,以其在多智能体系统决策中的卓越表现,成为当前主流方法.然而,传统的多智能体强化学习算法在面对维度爆炸、训练样本稀缺和难以迁移等方面仍然存在困难.为了克服这些挑战并提升算法性能,本文从学习... 强化学习作为人工智能领域的重要分支,以其在多智能体系统决策中的卓越表现,成为当前主流方法.然而,传统的多智能体强化学习算法在面对维度爆炸、训练样本稀缺和难以迁移等方面仍然存在困难.为了克服这些挑战并提升算法性能,本文从学习机制的角度入手,深入研究学习机制与强化学习的深度融合,以推动多智能体强化学习算法的发展.首先,介绍了多智能体强化学习算法的基本原理、发展历程以及算法所面临的难点.随后,引入了基于学习机制的多智能体强化学习方法这一种新兴方向.这些学习机制,如元学习和迁移学习,被证明可以有效提升多智能体的学习速度,并缓解维度爆炸等问题.按照课程学习、演化博弈、元学习、分层学习、迁移学习等学习机制在多智能体强化学习中的应用进行了综述,通过罗列这些方法的研究成果,论述了各种方法的局限性,并提出了未来改进的方向.总结了这类融合算法在实际应用中取得的提升成果和实际应用,具体列举了基于学习机制的多智能体强化学习算法在交通控制、游戏领域的实际应用案例.同时,对这类融合算法未来在理论、算法和应用方面的发展方向进行了深入分析.这涵盖了对新颖理论的探索、算法性能的进一步优化,以及在更广泛领域中的推广应用.通过这样的综述和分析,为未来多智能体强化学习算法的研究方向和实际应用提供了有益的参考. 展开更多
关键词 强化学习 多智能体博弈 学习机制 课程学习 演化强化学习
下载PDF
中高体积分数SiC_p/Al复合材料的力学性能及强化机制
15
作者 崔岩 廖家杰 +1 位作者 曹雷刚 杨越 《材料工程》 EI CAS CSCD 北大核心 2024年第4期110-119,共10页
采用热等静压粉末冶金工艺,以2024和6061铝合金为基体,分别制备体积分数为35%,45%,55%的中高体积分数SiC_(p)/Al复合材料。探究基体合金与SiC体积分数对复合材料力学性能的影响。结果表明:相同体积分数时,以2024铝合金为基体的复合材料... 采用热等静压粉末冶金工艺,以2024和6061铝合金为基体,分别制备体积分数为35%,45%,55%的中高体积分数SiC_(p)/Al复合材料。探究基体合金与SiC体积分数对复合材料力学性能的影响。结果表明:相同体积分数时,以2024铝合金为基体的复合材料具有更高的弯曲强度和弹性模量;但以6061铝合金为基体的复合材料则呈现出了更高的断裂应变。随着体积分数的增加,两类复合材料力学性能的变化规律相同,弯曲强度呈先增大后减小的趋势,当体积分数为45%时达到峰值,分别为656.54 MPa和548.00 MPa;弹性模量呈持续上升趋势,当体积分数为55%时分别达到202 GPa和188 GPa。基体合金差异对力学性能的影响在体积分数较低时更为明显,提高体积分数将会弱化这种差异。结合理论公式计算发现,对于微米级的增强体颗粒,Orowan机制带来的强化效应极小,可忽略不计;其他各类强化机制的强化效果将随着增强体体积分数的增加呈现不同程度的提高;几何必须位错强化和热错配强化对材料屈服强度的贡献始终占据主导地位。 展开更多
关键词 SIC_P/AL复合材料 体积分数 力学性能 强化机制
下载PDF
基于请求与应答通信机制和局部注意力机制的多机器人强化学习路径规划方法
16
作者 邓辅秦 官桧锋 +4 位作者 谭朝恩 付兰慧 王宏民 林天麟 张建民 《计算机应用》 CSCD 北大核心 2024年第2期432-438,共7页
为降低多机器人在动态环境下路径规划的阻塞率,基于深度强化学习方法框架Actor-Critic,设计一种基于请求与应答通信机制和局部注意力机制的分布式深度强化学习路径规划方法(DCAMAPF)。在Actor网络,基于请求与应答通信机制,每个机器人请... 为降低多机器人在动态环境下路径规划的阻塞率,基于深度强化学习方法框架Actor-Critic,设计一种基于请求与应答通信机制和局部注意力机制的分布式深度强化学习路径规划方法(DCAMAPF)。在Actor网络,基于请求与应答通信机制,每个机器人请求视野内的其他机器人的局部观测信息和动作信息,进而规划出协同的动作策略。在Critic网络,每个机器人基于局部注意力机制将注意力权重动态地分配到在视野内成功应答的其他机器人局部观测和动作信息上。实验结果表明,与传统动态路径规划方法D*Lite、最新的分布式强化学习方法MAPPER和最新的集中式强化学习方法AB-MAPPER相比,DCAMAPF在离散初始化环境,阻塞率均值均约降低了6.91、4.97、3.56个百分点;在集中初始化环境下能更高效地避免发生阻塞,阻塞率均值均约降低了15.86、11.71、5.54个百分点,并减少占用的计算缓存。所提方法确保了路径规划的效率,适用于求解不同动态环境下的多机器人路径规划任务。 展开更多
关键词 多机器人路径规划 深度强化学习 注意力机制 通信 动态环境
下载PDF
基于多智能体注意力机制的自动巡检路线强化学习模型
17
作者 欧嘉俊 曾伟良 +1 位作者 李谕锋 范竞敏 《广东工业大学学报》 CAS 2024年第5期39-47,71,共10页
合理的任务分配与巡检路线规划是确保机器人能够高效替代工程师完成变电站危险区域巡检任务的关键所在。然而,以往的研究大多局限于为变电设备规划固定的最短巡检路径,却鲜少考虑到设备检测时间和检验等级的差异性。为了进一步提升变电... 合理的任务分配与巡检路线规划是确保机器人能够高效替代工程师完成变电站危险区域巡检任务的关键所在。然而,以往的研究大多局限于为变电设备规划固定的最短巡检路径,却鲜少考虑到设备检测时间和检验等级的差异性。为了进一步提升变电站巡检的有效性和灵活性,本文在充分考虑检测时间、设备检验等级以及待检测设备数量差异性的基础上,构建了一个动态巡检路径规划模型。鉴于所建模型属于NP-hard问题,提出了一种基于强化学习和多智能体注意力机制的求解策略。在求解过程中,先利用具有注意力层的编码器-解码器框架生成巡检路径,随后通过无监督神经网络进行训练优化。最后,以南方电网某变电站作为实验点进行模型验证。与遗传算法、分层可变领域搜索算法和自适应并行蚁群算法相比,本文提出的算法在路径距离上分别缩短了3.31%,1.24%与1.73%,规划用时分别缩短了17.06%,16.22%与13.89%,单次巡检成本分别降低了21.22%,6.86%与9.14%,展现出显著的优越性。 展开更多
关键词 多智能体 变电站 路径规划 强化学习 注意力机制
下载PDF
基于改进奖励机制的深度强化学习目标检测
18
作者 陈盈君 武月 刘力铭 《计算机系统应用》 2024年第10期106-114,共9页
为提高深度强化学习目标检测模型的检测精度和检测速度,对传统模型进行改进.针对特征提取不充分的问题,使用融入通道注意力机制的VGG16特征提取模块作为强化学习的状态输入,来更全面地捕获图像中的关键信息;针对仅使用交并比作为奖励出... 为提高深度强化学习目标检测模型的检测精度和检测速度,对传统模型进行改进.针对特征提取不充分的问题,使用融入通道注意力机制的VGG16特征提取模块作为强化学习的状态输入,来更全面地捕获图像中的关键信息;针对仅使用交并比作为奖励出现的评价不精准问题,使用额外考虑了真实框与预测框中心点距离以及长宽比的改进奖励机制,使奖励更加合理;为加速训练过程的收敛并增强智能体对当前状态和动作评价的客观性,使用Dueling DQN算法进行训练.在PASCAL VOC2007和PASCAL VOC2012数据集上进行实验,实验结果表明,该检测模型仅需4–10个候选框即可检测到目标.与Caicedo-RL相比,准确率提高9.8%,最终预测框和真实框的平均交并比提高5.6%. 展开更多
关键词 目标检测 深度强化学习 VGG16 注意力机制 奖励机制 Dueling DQN
下载PDF
基于注意力机制和价值强化学习的WRSN一对多充电调度方法
19
作者 龚政 冯勇 《传感技术学报》 CAS CSCD 北大核心 2024年第8期1411-1423,共13页
在大规模无线可充电传感器网络(WRSN)中,一对一充电模型难以满足节点巨大能量需求,充电效率更高的一对多充电成为更合理选择。提出了一种基于注意力机制和价值强化学习的WRSN在线一对多充电调度方法(MAQRL),从充电序列和充电时长两方面... 在大规模无线可充电传感器网络(WRSN)中,一对一充电模型难以满足节点巨大能量需求,充电效率更高的一对多充电成为更合理选择。提出了一种基于注意力机制和价值强化学习的WRSN在线一对多充电调度方法(MAQRL),从充电序列和充电时长两方面优化移动充电设备(MC)调度。首先,基于MC有效充电范围覆盖最多节点对网络内节点进行分簇处理,并基于价值强化学习优化充电序列。MAQRL结合注意力机制和价值强化学习,利用注意力机制提取特征和MC对节点的注意力,利用双价值强化学习来减少高估,以提高充电方法的充电性能;其次,通过分析整个网络中节点的平均剩余生存时长和MC平均移动延迟,动态优化充电时间,减少后续节点因等待时间过长而导致的死亡。大量的仿真实验表明,与现有几种充电方法相比,MAQRL在降低节点死亡率和充电延迟方面具有显著优势。 展开更多
关键词 无线可充电传感器网络 充电调度 一对多充电 注意力机制 价值强化学习
下载PDF
全麦面包烘焙过程中抗性淀粉生成机制与营养强化策略
20
作者 岩蓉 张荣 《食品安全导刊》 2024年第15期125-127,共3页
随着公众健康饮食意识的提高及慢性疾病预防需求的增长,富含膳食纤维、微量元素及生物活性成分的全麦面包日益受到关注。其中,抗性淀粉作为一种具有独特生理功能的碳水化合物,其在烘焙过程中的生成机制及其对全麦面包营养价值与功能特... 随着公众健康饮食意识的提高及慢性疾病预防需求的增长,富含膳食纤维、微量元素及生物活性成分的全麦面包日益受到关注。其中,抗性淀粉作为一种具有独特生理功能的碳水化合物,其在烘焙过程中的生成机制及其对全麦面包营养价值与功能特性的影响成为食品科学领域的重要研究课题。抗性淀粉不仅改变全麦面包的消化特性,还与多项健康益处相关,如改善肠道微生态、调节血糖反应及增强饱腹感等。本文重点探讨了全麦面包烘焙过程中抗性淀粉的生成机制,并据此提出针对性的营养强化策略,以提升其作为健康食品的价值,并为全麦面包的生产和研发提供有价值的参考,以满足消费者对营养均衡、功能性强的食品的诉求。 展开更多
关键词 全麦面包 抗性淀粉 烘焙过程 生成机制 营养强化
下载PDF
上一页 1 2 163 下一页 到第
使用帮助 返回顶部