期刊文献+
共找到96,412篇文章
< 1 2 250 >
每页显示 20 50 100
超声在湿法冶金过程强化中的应用进展与展望
1
作者 林国 钟震 +4 位作者 夏洪应 胡途 王仕兴 李世伟 张利波 《有色金属(冶炼部分)》 北大核心 2025年第2期17-34,共18页
传统湿法冶金技术存在反应速度慢、处理效率低、能耗高以及环境污染等局限性。为了克服这些限制,超声技术作为一种新兴的湿法冶金强化手段,因其高效、环保的特性展现出巨大的应用潜力。综述了超声技术在湿法冶金中的应用,包括其基本原... 传统湿法冶金技术存在反应速度慢、处理效率低、能耗高以及环境污染等局限性。为了克服这些限制,超声技术作为一种新兴的湿法冶金强化手段,因其高效、环保的特性展现出巨大的应用潜力。综述了超声技术在湿法冶金中的应用,包括其基本原理、作用机制,以及在浮选、矿物粉碎、浸出、萃取、金属电沉积、吸附/脱附过程和纳米材料合成等多个环节中的积极作用。超声技术通过增强化学反应过程,加速浸出,提升金属提取效率,同时减少化学试剂的使用,降低环境污染。此外,超声技术还在提高产品纯度、改善晶体生长和沉积物形态等方面具有积极作用。随着技术的发展,超声技术有望在推动湿法冶金行业向更绿色、环保的方向发展中发挥更加重要的作用。 展开更多
关键词 超声波 湿法冶金 过程强化 应用进展
下载PDF
DCE-MRI对肉芽肿性乳腺炎与非肿块样强化乳腺癌鉴别诊断价值
2
作者 段小玲 陈淑明 张盼 《中国CT和MRI杂志》 2025年第1期103-105,共3页
目的 分析肉芽肿性乳腺炎(GM)和非肿块样强化(NMLE)乳腺癌在磁共振动态增强(DCE-MRI)影像特征,以提高GM和乳腺癌的鉴别诊断。方法 回顾性分析60例在DCE-MRI表现为非肿块样强化(NMLE)病变,分析N MLE病变的弥散加权成像(DWI)信号特点、强... 目的 分析肉芽肿性乳腺炎(GM)和非肿块样强化(NMLE)乳腺癌在磁共振动态增强(DCE-MRI)影像特征,以提高GM和乳腺癌的鉴别诊断。方法 回顾性分析60例在DCE-MRI表现为非肿块样强化(NMLE)病变,分析N MLE病变的弥散加权成像(DWI)信号特点、强化分布及强化方式,采用Pearson卡方检验对环状强化的分布、不同期相环壁强化程度。结果NMLE中GM组25例,强化分布(局灶3例、区域8例、多区域性5例、线样或导管样0例、段性6例、弥漫性3例),强化方式(不均匀2例、大小不等环23例),病灶实性区时间信号曲线(TIC)Ⅰ型9例,Ⅲ型16例,Ⅲ型曲线0例;NMLE中乳腺癌组35例,强化分布(局灶性5例、区域性15例、多区域性5例、线样或导管样3例、段性4例、弥漫性4例),强化方式(均匀强化3例、不均匀强化6例、集簇/簇环状26例),病灶实性区TIC曲线Ⅰ型7例,Ⅱ型12例及Ⅲ例16例, NMLE中GM组与乳腺癌在病灶环壁及环内容物DWI高信号(P=0.00、 P=0.00),大小不等环形强化(P=0.02),集簇/簇环状强化(P=0.01),病灶环壁晚期显著强化程度(P=0.01)有统计学意义,病灶环壁早期显著强化(P=0.07)无统计学意义。结论以线样、段样强化分布及以小簇环状强化的NMLE病变多提示恶性肿瘤;以区域或弥漫性强化分布伴大小不等环状强化的非肿块样强化,且随时间延迟渐进性均匀强化的病变多提示GM。 展开更多
关键词 动态增强磁共振 非肿块样强化 肉芽肿性乳腺炎 乳腺癌
下载PDF
新型多通道扭带强化传热性能的数值模拟
3
作者 陆威 熊松宁 +1 位作者 吴志根 刘柏群 《石油化工》 北大核心 2025年第1期15-21,共7页
采用数值模拟的方法,研究了内插具有交替顺、逆时针扭转方向(C-CC)结构的多通道扭带的换热管在Re=6000~12000范围内的流动传热特性。模拟结果表明,插有C-CC结构多通道扭带的换热管的Nu与通道数量(N)和Re呈正相关,与扭转比(T_(R))负相关... 采用数值模拟的方法,研究了内插具有交替顺、逆时针扭转方向(C-CC)结构的多通道扭带的换热管在Re=6000~12000范围内的流动传热特性。模拟结果表明,插有C-CC结构多通道扭带的换热管的Nu与通道数量(N)和Re呈正相关,与扭转比(T_(R))负相关,相对于经典扭带(N=2)最高提升了30.7%;摩擦系数与N呈正相关,与Re和T_(R)负相关,相对于经典扭带最高增加了304%;综合换热因子与Re和N呈负相关,随T_(R)的增加先增加后减小,最高为0.887。较小T_(R)时,所研究的新型C-CC结构多通道扭带有着比常规多通道扭带更好的强化传热性能。 展开更多
关键词 数值模拟 多通道扭带 强化传热 场协同
下载PDF
基于算子学习的多目标深度强化学习模型求解消防设施选址问题
4
作者 刘勇 刘宇轩 马良 《计算机应用研究》 北大核心 2025年第2期477-485,共9页
针对消防设施选址问题,构建考虑时效性、市民等待救援的焦急心理和建设成本的三目标消防设施选址模型,以实现更科学的消防设施布局。鉴于该问题的NP难特性,提出基于算子学习的多目标深度强化学习模型(multi-objective deep reinforcemen... 针对消防设施选址问题,构建考虑时效性、市民等待救援的焦急心理和建设成本的三目标消防设施选址模型,以实现更科学的消防设施布局。鉴于该问题的NP难特性,提出基于算子学习的多目标深度强化学习模型(multi-objective deep reinforcement learning,MDRL)。设计多种优化算子作为强化学习的动作空间,训练策略网络以选择最佳优化算子来改进解决方案。针对多目标问题,设计基于优势差异的方法(MDRL-AD)和基于支配性评估的方法(MDRL-DE)。采用四种规模的测试算例及实际案例进行数值实验,将MDRL和改进的NSGA-Ⅱ、MOPSO、L2I算法进行比较,并利用Hypervolume指标、Spacing指标、Ω指标、IGD指标对算法性能进行评估。实验结果表明,MDRL-AD方法更适用于求解小规模算例,MDRL-DE方法则在求解大规模和超大规模算例时相比其他算法优势明显。MDRL在非劣解集的收敛性和均匀性方面明显优于其他对比算法,为消防设施布局规划提供了一种有竞争力的解决方案。 展开更多
关键词 深度强化学习 算子学习 优化算子 多目标优化 消防设施选址问题
下载PDF
W元素在新型镍基粉末高温合金中的强化作用
5
作者 贾建 罗俊鹏 +3 位作者 张浩鹏 闫婷 侯琼 张义文 《材料导报》 EI CAS CSCD 北大核心 2024年第15期50-55,共6页
通过真空感应熔炼(VIM)棒料+电极感应熔炼氩气雾化(EIGA)制粉+热等静压(HIP)成形+热处理(HT)工艺制备三种W含量(质量分数4.1%、6.1%和8.1%)的新型镍基粉末高温合金实验锭坯。以此锭坯为对象,结合金属材料相图计算及材料性能模拟软件JMat... 通过真空感应熔炼(VIM)棒料+电极感应熔炼氩气雾化(EIGA)制粉+热等静压(HIP)成形+热处理(HT)工艺制备三种W含量(质量分数4.1%、6.1%和8.1%)的新型镍基粉末高温合金实验锭坯。以此锭坯为对象,结合金属材料相图计算及材料性能模拟软件JMatPro 6.5计算,利用SEM、EBSD和XRD分析W含量对热处理态锭坯显微组织(如晶粒尺寸、退火孪晶、γ′强化相及错配度)的影响,测试分析不同温度下合金的拉伸性能,通过经验公式量化分析各强化机制对合金室温屈服强度的贡献情况。结果表明,随着W含量增加,γ基体层错能明显降低,热处理态退火孪晶界Σ3数量增多;W促使晶内一次γ′强化相由立方状加速粗化为固态枝晶状,对γ′总量和二次、三次γ′的影响不大;W进入γ基体产生晶格畸变的程度大于γ′强化相,使得γ′/γ错配度呈下降趋势;W有助于提高室温和650~800℃拉伸强度,但略微降低塑性;W主要起固溶强化、γ/γ′共格应变强化和晶界强化作用,其中固溶强化贡献相对最低,固溶强化时以强化γ基体为主,γ基体固溶强化和γ/γ′共格应变强化效果随W含量增加而减弱,W含量为6.1%时晶界强化效果最大;固溶强化、γ/γ′共格应变强化和晶界强化贡献值总和不足室温屈服强度实测值的50%,合金以γ′相沉淀强化为主,测试值和计算值较为吻合。 展开更多
关键词 粉末高温合金 退火孪晶 错配度 层错能 固溶强化 共格应变强化 晶界强化 沉淀强化
下载PDF
逆强化学习算法、理论与应用研究综述
6
作者 宋莉 李大字 徐昕 《自动化学报》 EI CAS CSCD 北大核心 2024年第9期1704-1723,共20页
随着高维特征表示与逼近能力的提高,强化学习(Reinforcement learning,RL)在博弈与优化决策、智能驾驶等现实问题中的应用也取得显著进展.然而强化学习在智能体与环境的交互中存在人工设计奖励函数难的问题,因此研究者提出了逆强化学习(... 随着高维特征表示与逼近能力的提高,强化学习(Reinforcement learning,RL)在博弈与优化决策、智能驾驶等现实问题中的应用也取得显著进展.然而强化学习在智能体与环境的交互中存在人工设计奖励函数难的问题,因此研究者提出了逆强化学习(Inverse reinforcement learning,IRL)这一研究方向.如何从专家演示中学习奖励函数和进行策略优化是一个重要的研究课题,在人工智能领域具有十分重要的研究意义.本文综合介绍了逆强化学习算法的最新进展,首先介绍了逆强化学习在理论方面的新进展,然后分析了逆强化学习面临的挑战以及未来的发展趋势,最后讨论了逆强化学习的应用进展和应用前景. 展开更多
关键词 强化学习 强化学习 线性逆强化学习 深度逆强化学习 对抗逆强化学习
下载PDF
基于深度强化学习的游戏智能引导算法
7
作者 白天 吕璐瑶 +1 位作者 李储 何加亮 《吉林大学学报(理学版)》 北大核心 2025年第1期91-98,共8页
针对传统游戏智能体算法存在模型输入维度大及训练时间长的问题,提出一种结合状态信息转换与奖励函数塑形技术的新型深度强化学习游戏智能引导算法.首先,利用Unity引擎提供的接口直接读取游戏后台信息,以有效压缩状态空间的维度,减少输... 针对传统游戏智能体算法存在模型输入维度大及训练时间长的问题,提出一种结合状态信息转换与奖励函数塑形技术的新型深度强化学习游戏智能引导算法.首先,利用Unity引擎提供的接口直接读取游戏后台信息,以有效压缩状态空间的维度,减少输入数据量;其次,通过精细化设计奖励机制,加速模型的收敛过程;最后,从主观定性和客观定量两方面对该算法模型与现有方法进行对比实验,实验结果表明,该算法不仅显著提高了模型的训练效率,还大幅度提高了智能体的性能. 展开更多
关键词 深度强化学习 游戏智能体 奖励函数塑形 近端策略优化算法
下载PDF
集成深度强化学习在股票指数投资组合优化中的应用分析
8
作者 冀中 张文嘉 《计算机科学与探索》 北大核心 2025年第1期237-244,共8页
基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法... 基于集成深度强化学习的投资组合选择是当前量化金融领域的关键技术之一。然而,目前采用上一窗口阶段最优指标决定下一阶段代理的集成滚动窗口方法存在一定的滞后性。为了有效应对这一不足,提出了双层嵌套集成深度强化学习方法。该方法对三种代理(优势演员-评论员、深度确定性策略梯度和近端策略优化)进行两层嵌套模式,第一层集成通过最优化夏普比率进行阶段模型选择,第二层通过加权投票的方法集成三种深度强化学习算法,从单次训练中收集多个模型快照,在训练期间利用这些模型进行集成预测。分别对上证50投资指数和道琼斯指数及其包含的股票进行了投资组合研究,将持有指数被动策略和均值方差投资组合策略作为基线策略。实验采用了投资组合价值、年化回报率、年化波动率、最大回撤和夏普比率等指标作为对比指标。结果表明,所提出的集成方法在实用性和有效性上表现出较好的性能。 展开更多
关键词 股票投资组合 交易策略 深度强化学习 双层嵌套集成深度强化学习方法 集成学习
下载PDF
基于证据的强化培训与监测管理对医院多重耐药菌感染防控的影响研究
9
作者 黄琦 杨天富 +1 位作者 姜成安 陈真飞 《现代医院》 2025年第1期140-142,147,共4页
目的 分析基于证据的强化培训和监测管理对医院多重耐药菌(multidrug resistant organism, MDRO)感染防控的影响。方法 采用方便抽样的方法,从本院病历系统中选择2020-2023年4年住院患者的资料进行调查,以2022年1月为节点,将2020年1月-2... 目的 分析基于证据的强化培训和监测管理对医院多重耐药菌(multidrug resistant organism, MDRO)感染防控的影响。方法 采用方便抽样的方法,从本院病历系统中选择2020-2023年4年住院患者的资料进行调查,以2022年1月为节点,将2020年1月-2021年12月收治的本院86 564患者作为对照组(管理前);2022年1月-2023年12月收治的本院93 215例患者作为干预组(管理后)。管理前患者进行常规感染防控管理,管理后患者采用基于证据的强化培训与监测管理防控感染。分析并比较管理实施前后患者的MDRO总检出率、MDRO医院感染发生率、患者抗菌药物使用率、医务人员MDRO防控措施执行率、MDRO医院感染防控知识考核情况等指标。结果 管理后,医院MDRO总检出率、MDRO医院感染总发生千分率低于管理前(χ^(2)=4.22、16.078,P<0.05);患者抗菌药物使用率下降(χ^(2)=21.387,P<0.01),患者使用前病原学送检率上升(χ^(2)=9.726,P<0.05);医务人员对MDRO医院感染防控知识合格率(96.36%)明显高于管理前(80.00%)(χ^(2)=12.654,P<0.05);手卫生、环境清洁和消毒、隔离标识、单间/床旁隔离、诊疗物品专用、落实标准预防执行率由管理前的81.82%、80.91%、79.09%、80.00%、77.27%、80.91%上升至98.18%、98.18%、96.36%、96.36%、98.18%、98.18%(χ^(2)=16.364、17.528、15.240、14.132、22.334、17.528,P<0.05)。结论 基于证据的强化培训和监测管理能有效降低MDRO检出率及医院感染率,促进抗菌药物的合理使用,提高医疗质量。 展开更多
关键词 多重耐药菌 强化培训 监测管理 防控感染 影响
下载PDF
ICU护理强化训练对实习生操作能力的影响分析
10
作者 何宗广 《中国科技期刊数据库 科研》 2025年第1期009-012,共4页
研究实习医生接受ICU护理强化训练指导的有效价值。方法 选取2022-2024年在医院加入ICU实习的医学生72名开展观察活动,随机划分两组,有常规训练指导的常规训练组、强化训练指导的强化训练组,统计两组实习生的操作能力提升情况、批判性... 研究实习医生接受ICU护理强化训练指导的有效价值。方法 选取2022-2024年在医院加入ICU实习的医学生72名开展观察活动,随机划分两组,有常规训练指导的常规训练组、强化训练指导的强化训练组,统计两组实习生的操作能力提升情况、批判性思维培养情况和医学生满意度评分结果。结果 训练前,两组实习生人文关怀项目、无菌观察项目、操作步骤项目和熟练程度项目的评分数值之间比较,对应p>0.05。训练后,强化训练组实习生人文关怀项目评分均值(21.03±0.56)、无菌观察项目评分均值(22.04±0.12)、操作步骤项目评分均值(21.34±0.72)、熟练程度项目评分均值(22.06±0.59),分数均较常规训练组高,对应p<0.05;训练前,两组实习生注意真相、开放理念、研究动力、系统化思维、实践信心、认知程度等评分数值之间比较,对应p>0.05。训练后,强化训练组实习生注意真相评分均值(86.73±6.29)、开放理念评分均值(85.71±5.29)、研究动力评分均值(88.46±7.15)、系统化思维评分均值(89.43±6.33)、实践信心评分均值(85.77±5.43)、认知程度评分均值(86.91±4.16),分数均较常规训练组高,对应p<0.05;强化训练组的实习生在训练内容、训练方法和训练态度等方面的评分较常规训练组高,对应p<0.05。结论 实习生的临床技能培养中,需要大力宣传ICU护理强化训练模式,更好地提高实习生操作能力、批判性思维,得到实习生的满意度评价。 展开更多
关键词 ICU护理 强化训练 医学生 操作能力 应用价值
下载PDF
基于深度强化学习的工业物联网路由优化方法
11
作者 莫丽娟 张梦榛 《物联网技术》 2025年第2期82-84,共3页
常规的工业物联网路由优化协议多以独立形式设定,链路利用率大幅度降低,为此提出了基于深度强化学习的工业物联网路由优化方法。根据当前的路由优化需求,先进行实时监测节点部署及路由运行数据采集,采用多阶的方式扩大覆盖范围,制定多... 常规的工业物联网路由优化协议多以独立形式设定,链路利用率大幅度降低,为此提出了基于深度强化学习的工业物联网路由优化方法。根据当前的路由优化需求,先进行实时监测节点部署及路由运行数据采集,采用多阶的方式扩大覆盖范围,制定多阶路由协议,后以此为基础,构建工业物联网路由优化模型,采用离散化辅助处理实现路由优化。最终测试结果表明:应用所提方法,最终得出的链路利用率提升比均可以达到5.5以上,所设计方法的针对性更强,应用效果更佳。 展开更多
关键词 深度强化学习 工业物联网 路由优化 离散化辅助 网络接入 工业指令
下载PDF
无人机姿态控制深度强化学习算法系统对比与性能分析
12
作者 林嘉坤 董振宇 黄键耿 《中国科技信息》 2025年第2期73-75,共3页
无人机作为一种灵活的空中平台,很大程度上依赖于其姿态控制。姿态控制是指通过调整机体姿态以实现预定飞行的技术。深度强化学习(Deep Reinforcement Learning, DRL)作为一种新兴的智能控制算法,由于能够处理高维度状态空间和持续动作... 无人机作为一种灵活的空中平台,很大程度上依赖于其姿态控制。姿态控制是指通过调整机体姿态以实现预定飞行的技术。深度强化学习(Deep Reinforcement Learning, DRL)作为一种新兴的智能控制算法,由于能够处理高维度状态空间和持续动作空间的特性。 展开更多
关键词 深度强化学习 智能控制算法 强化学习算法 状态空间 姿态控制 高维度 空中平台 无人机
下载PDF
瑞士乳杆菌与耐酸乳杆菌复合强化对液态发酵食醋风味的影响
13
作者 黄浩伦 陆震鸣 +5 位作者 柴丽娟 张晓娟 许泓瑜 李信 史劲松 许正宏 《食品与发酵工业》 CAS 北大核心 2025年第1期143-150,共8页
该研究将瑞士乳杆菌(Lactobacillus helveticus)与耐酸乳杆菌(Lactobacillus acetotolerans)分阶段接种于液态发酵食醋的发酵过程中,以提升食醋品质。采用高效液相色谱、顶空固相微萃取-气质联用和电子舌等分析方法,对液态发酵食醋的有... 该研究将瑞士乳杆菌(Lactobacillus helveticus)与耐酸乳杆菌(Lactobacillus acetotolerans)分阶段接种于液态发酵食醋的发酵过程中,以提升食醋品质。采用高效液相色谱、顶空固相微萃取-气质联用和电子舌等分析方法,对液态发酵食醋的有机酸含量、挥发性化合物含量进行分析并对其进行感官评价。结果表明,L.helveticus L-6与L.acetotolerans L-9复合强化后,液态发酵食醋总酸可达5.15 g/100 mL;还原糖残留量为3.41 g/L;乳酸、丙酮酸含量提升显著,其中乳酸含量提升幅度最大,可达12.8 g/L;复合强化可以显著提升乙酸乙酯、乳酸乙酯、苯乙酸等具有花果香、奶香和甜香风味的挥发性化合物含量;感官评价结果表明,两种乳酸菌分阶段复合强化发酵的食醋甜味和鲜味增加且酸味明显减弱,风味品质明显提升。该研究证实了在液态发酵食醋的发酵过程中进行L.helveticus L-6与L.acetotolerans L-9复合强化,有助于优化食醋有机酸组成,提升食醋的风味品质,为食醋的酿造工艺优化和产品创新提供参考。 展开更多
关键词 乳酸菌 液态发酵食醋 生物强化 有机酸 风味
下载PDF
种芽生物营养强化机的设计与试验
14
作者 李菁 闫景凤 +5 位作者 韩休海 任洪忱 张庆柱 孙锦秀 李尧 刘洪义 《农机化研究》 北大核心 2025年第1期87-92,共6页
针对营养功能性农产品供给不足和生物营养强化技术装备落后等问题,设计了种芽生物营养强化机。采取提高组分浓度差、压力差,以及透水交变真空等快速催芽技术,解决营养组分向种芽内高效传质问题。经绿豆芽富叶酸营养强化试验和发芽糙米... 针对营养功能性农产品供给不足和生物营养强化技术装备落后等问题,设计了种芽生物营养强化机。采取提高组分浓度差、压力差,以及透水交变真空等快速催芽技术,解决营养组分向种芽内高效传质问题。经绿豆芽富叶酸营养强化试验和发芽糙米富钙营养强化试验研究,结果表明:种芽生物营养强化机可生产高营养价值农产品,其生产的绿豆芽中叶酸含量可达1.486 mg/kg,发芽糙米中钙含量可达757 mg/kg,营养强化效果良好。 展开更多
关键词 种芽 生物营养强化 高营养 功能农业
下载PDF
多铜氧化酶和3-磷酸甘油醛脱氢酶基因强化表达对植物乳杆菌降解组胺的影响
15
作者 杜晓仪 徐玉娟 +4 位作者 吴继军 余元善 彭健 杨继国 李璐 《食品与发酵工业》 北大核心 2025年第2期25-34,共10页
植物乳杆菌(Lactiplantibacillus plantarum)是降解发酵食品组胺的常见菌株之一,但其降解组胺的关键基因尚未明晰,阻碍组胺降解L.plantarum的分子育种。为揭示L.plantarum降解组胺的关键基因,该研究从发酵蔬菜中筛选出一株具有组胺降解... 植物乳杆菌(Lactiplantibacillus plantarum)是降解发酵食品组胺的常见菌株之一,但其降解组胺的关键基因尚未明晰,阻碍组胺降解L.plantarum的分子育种。为揭示L.plantarum降解组胺的关键基因,该研究从发酵蔬菜中筛选出一株具有组胺降解能力的L.plantarum,对其进行菌株特性和全基因组分析,并通过强化表达挖掘L.plantarum降解组胺的关键基因。结果表明,筛选菌株对组胺的降解率在48 h达到最高(20.16%)。形态学和分子生物学鉴定结果表明该菌株为L.plantarum,命名为L.plantarum CY087。该菌株对高组胺环境具有较好的耐受性,而对低酸、高盐环境的耐受性较差。多铜氧化酶基因(mcO)和3-磷酸甘油醛脱氢酶基因(gapdH)在L.plantarum CY087中的强化表达均能提高其组胺降解率。与菌株CY087-36e相比,CY087-gapdH与CY087-mcO的组胺降解率分别提高了31.94%和16.14%,说明gapdH基因在L.plantarum CY087降解组胺的过程中发挥了较为关键的作用。研究为组胺降解L.plantarum的分子改造提供潜在靶点。 展开更多
关键词 菌株筛选 植物乳杆菌 组胺降解 强化表达
下载PDF
结合元学习和安全区域探索的进化强化学习方法
16
作者 李晓益 胡滨 +1 位作者 秦进 彭安浪 《计算机工程与应用》 北大核心 2025年第1期361-367,共7页
最近提出的进化强化学习(evolutionary reinforcement learning,ERL)框架表明了利用进化算法提高强化学习的探索能力对性能提升的好处。然而,现有的基于ERL的方法并没有完全解决进化算法中突变的可伸缩性问题且由于进化算法本身的限制使... 最近提出的进化强化学习(evolutionary reinforcement learning,ERL)框架表明了利用进化算法提高强化学习的探索能力对性能提升的好处。然而,现有的基于ERL的方法并没有完全解决进化算法中突变的可伸缩性问题且由于进化算法本身的限制使得ERL解决问题的速度较为缓慢。为了使算法每一步的探索都被限制在安全区域中且能在较短的时间内收敛,运用元学习的思想,预训练一个初始的种群,这个种群只需要经过几次进化就能得到任务中不错的效果。将预训练过后的种群用于处理任务,在此过程中,利用敏感度调整种群突变的范围,限制种群在安全区域内进行突变,确保种群的突变不会带来无法预料的后果。该方法在来自OpenAI gym中的五种机器人运动中进行了评估。最终在所有测试的环境中,该方法在以ERL、CEM-RL以及两种最先进的RL算法、PPO和TD3为基线的比较中,取得了具有竞争性的效果。 展开更多
关键词 进化强化学习 元学习 预训练 安全区域 突变算子
下载PDF
基于界面蒸发的太阳能蒸馏器能量分析与性能强化
17
作者 代振江 苏风民 +4 位作者 樊益明 范乐天 韦成书 常超 纪玉龙 《可再生能源》 北大核心 2025年第1期36-44,共9页
传统底部加热式太阳能蒸馏器的热效率较低,界面蒸发技术可以将热量局限在蒸发界面,进而快速产生水蒸汽,实现太阳能的高效利用。文章制备了一种以碳纳米粉为光热转换材料,聚乙烯醇水凝胶包覆的复合界面蒸发器,并在此基础上,设计了一种单... 传统底部加热式太阳能蒸馏器的热效率较低,界面蒸发技术可以将热量局限在蒸发界面,进而快速产生水蒸汽,实现太阳能的高效利用。文章制备了一种以碳纳米粉为光热转换材料,聚乙烯醇水凝胶包覆的复合界面蒸发器,并在此基础上,设计了一种单效太阳能蒸馏器。首先,通过理论计算,分析了蒸馏器产水过程中的能量分布,发现冷凝面的阳光反射和蒸发界面的热传导是导致蒸馏器能量损失的两个主要因素;然后,通过调控冷凝面润湿性,改善其透光性,减少阳光反射,使蒸发界面能够接收到更多太阳能,冷凝面亲水改性使蒸馏器热效率从36.1%提高到55.4%,优化蒸发器供水结构可降低蒸发界面导热损失,在20%供水面积比例时,其热效率提高到64.6%;最后,在室外实际条件下测试了蒸馏器的产水性能,系统稳定运行,无盐结晶出现,全天产水量达到2.89 kg/m~2。此研究可为太阳能蒸馏器设计和性能改进提供理论指导。 展开更多
关键词 界面蒸发 太阳能蒸馏器 能量分析 性能强化
下载PDF
基于强化学习的完全分布式事件驱动二分一致性算法
18
作者 蔡玉良 吕春慧 +6 位作者 何强 于波 陈东岳 王友童 王强 刘宇轩 赵婧婧 《计算机科学》 北大核心 2025年第2期279-290,共12页
使用强化学习(Reinforcement Learning,RL)方法和基于事件驱动的完全分布式控制策略来研究系统模型信息未知的多智能体系统(MASs)的二分一致性问题。首先,基于状态阈值和时间阈值提出了一种混合事件触发机制,用于减少智能体间的通信频... 使用强化学习(Reinforcement Learning,RL)方法和基于事件驱动的完全分布式控制策略来研究系统模型信息未知的多智能体系统(MASs)的二分一致性问题。首先,基于状态阈值和时间阈值提出了一种混合事件触发机制,用于减少智能体间的通信频率。其次,利用局部采样的状态信息设计了一个自适应事件触发一致性控制协议,使所有追随智能体的二分一致性误差最终趋于零。通过排除有限时间内的芝诺(Zeno)行为,证实了上述事件触发机制的有效性。然后,基于RL方法提出了一种无模型算法来获得反馈增益矩阵,并在模型信息未知的情况下实现了自适应事件触发控制策略的构建。与现有的相关工作不同,这种基于RL的事件触发自适应控制算法只依赖于局部采样的状态信息,与任何模型信息或全局网络信息无关。此外,将上述结果扩展到切换拓扑情形,这更具挑战性,因为状态估计在以下两种情况下更新:1)交互图切换时;2)事件触发机制满足时。最后,通过实例验证了上述自适应事件触发控制算法的有效性。 展开更多
关键词 强化学习 事件驱动 完全分布式控制 多智能体系统 二分一致性
下载PDF
求解外卖配送问题的深度强化学习算法
19
作者 张旭阳 刘勇 马良 《计算机应用研究》 北大核心 2025年第1期205-213,共9页
以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来... 以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来模拟智能体与环境的交互过程;其次,在编码阶段设计多特征聚合嵌入子层,实现特征间的优势互补并提高模型对非线性问题的建模能力;最后,在解码阶段通过注意力机制和指针网络计算解的概率分布,采用策略梯度算法对网络模型进行训练。通过经典算例和长春市仿真案例的相关实验分析,结果表明该算法能够有效地求解外卖配送问题,且与其他启发式算法相比,具有更高的稳定性和求解精度。此外,进行参数灵敏度实验,考虑不同定价策略对外卖配送的影响,使研究结果更具现实意义。 展开更多
关键词 外卖配送问题 最小比率旅行商问题 深度强化学习 多特征嵌入 注意力机制
下载PDF
大米强化技术及其应用研究进展
20
作者 王锐 丁春阳 +3 位作者 武陈晨 贾春艳 张娜 刘晓飞 《粮食与油脂》 北大核心 2025年第2期12-16,23,共6页
介绍了水稻收获前和收获后阶段的全谷物强化技术及提高微量营养素吸收率的辅助方法,同时对营养强化米的发展前景进行展望,以期为营养强化米的研究开发提供参考。
关键词 大米 隐性饥饿 强化技术 微量营养素
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部