-
题名基于SAC的炼厂原油储运调度方法
- 1
-
-
作者
马楠
李洪奇
刘华林
杨磊
-
机构
中国石油大学(北京)信息科学与工程学院
中国石油天然气股份有限公司规划总院
中国石油天然气股份有限公司油气业务链优化重点实验室
-
出处
《化工进展》
EI
CAS
CSCD
北大核心
2024年第3期1167-1177,共11页
-
基金
直属院所基础研究和战略储备技术研究基金(KJ2021-316)。
-
文摘
目前对于炼厂原油储运调度决策的研究大多采用基于数学规划的静态调度方案,求解时间较长并且无法针对环境的变化进行实时高效的储运调度优化。为此,本文结合深度强化学习算法建立了考虑炼厂生产约束的原油资源储运动态实时调度决策算法。该算法首先将炼厂原油资源调度问题转换为马尔可夫决策过程,其次提出了一种基于软演员-评论家(soft actor-critic,SAC)的深度强化学习算法来同时确定调度过程中的传输目标等离散决策以及传输速度等连续决策。结果表明,算法学习到的策略可行性较好,与基线算法相比,油轮在港时间、调度方案事件数量、加工计划执行率等重要指标方面均得到了较好的效果,在求解时间方面大幅提升至毫秒级,并有效控制随机事件对整体决策的影响范围。该算法可为沿海炼厂原油储运调度快速决策提供新的思路。
-
关键词
炼厂原油储运
资源调度
深度强化学习
软演员-评论家
-
Keywords
refinery crude oil storage and transportation
resource scheduling
deep reinforcement learning
soft actor-critic(SAC)
-
分类号
TE624
[石油与天然气工程—油气加工工程]
-