检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于SAC的炼厂原油储运调度方法: 1; 作者马楠李洪奇 +1 位作者刘华林杨磊《化工进展》 EI CAS CSCD 北大核心 2024年第3期1167-1177,共11页; 目前对于炼厂原油储运调度决策的研究大多采用基于数学规划的静态调度方案,求解时间较长并且无法针对环境的变化进行实时高效的储运调度优化。为此,本文结合深度强化学习算法建立了考虑炼厂生产约束的原油资源储运动态实时调度决策算法... 展开更多; 关键词炼厂原油储运资源调度深度强化学习软演员-评论家; 下载PDF 职称材料

基于强化学习的电磁悬浮型磁浮列车悬浮控制: 2; 作者胡轲珽徐俊起 +1 位作者刘志刚林国斌《同济大学学报（自然科学版）》 EI CAS CSCD 北大核心 2023年第3期332-340,共9页; 为了保证磁浮列车的安全、可靠运行,研究了悬浮系统在参数摄动条件下的悬浮控制问题。首先,对电磁悬浮(EMS)型磁浮列车的基本悬浮单元建模,给出了电流控制模型;然后,建立了悬浮系统的强化学习环境以及软演员-评论家(SAC)智能体,并设计... 展开更多; 关键词电磁悬浮(EMS)型磁浮列车悬浮控制强化学习控制软演员-评论家(SAC)智能体奖励函数设计; 下载PDF 职称材料

一种平衡探索和利用的优先经验回放方法: 3; 作者张佳能李辉 +1 位作者吴昊霖王壮《计算机科学》 CSCD 北大核心 2022年第5期179-185,共7页; 经验回放方法可以重用过去的经验来更新目标策略,提高样本的利用率,已经成为深度强化学习的一个重要组成部分。优先经验回放在经验回放的基础上进行选择性采样,期望更好地利用经验样本。但目前的优先经验回放方式会降低从经验缓冲池采... 展开更多; 关键词强化学习经验回放优先采样利用探索软演员-评论家算法; 下载PDF 职称材料

基于双智能体深度强化学习的交直流配电网经济调度方法: 4; 作者赵倩宇韩照洋 +3 位作者王守相尹孜阳董逸超钱广超《天津大学学报（自然科学与工程技术版）》 EI CAS 2024年第6期624-632,共9页; 随着大量直流电源和负荷的接入,交直流混合的配电网技术已成为未来配电网的发展趋势.然而,源荷不确定性及可调度设备的类型多样化给配电网调度带来了巨大的挑战.本文提出了基于分支决斗深度强化网络(branching dueling Q-network,BDQ)... 展开更多; 关键词交直流配电网深度强化学习经济调度分支决斗深度强化网络软演员-评论家; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部