-
题名基于深度强化学习与迭代贪婪的流水车间调度优化
被引量:24
- 1
-
-
作者
王凌
潘子肖
-
机构
清华大学自动化系
-
出处
《控制与决策》
EI
CSCD
北大核心
2021年第11期2609-2617,共9页
-
基金
国家杰出青年科学基金项目(61525304)
国家自然科学基金项目(61873328).
-
文摘
流水车间调度是应用背景最为广泛的调度问题,其智能算法研究具有重要的学术意义和应用价值.以最小化最大完工时间为目标,提出求解流水车间调度的一种基于深度强化学习与迭代贪婪算法的框架.首先,设计一种新的编码网络对问题进行建模,解决了传统模型受问题规模影响而难以扩展的缺陷,并利用强化学习训练模型以获取优良输出结果;然后,提出一种带反馈机制的迭代贪婪算法,以网络的输出结果为初始解,协同利用多种局部操作提高搜索能力,并根据性能反馈调节各操作的使用,进而获得最终的调度解.仿真结果和统计对比表明,所提出的深度强化学习与迭代贪婪融合的算法能够取得更好的性能.
-
关键词
流水车间调度
深度强化学习
迭代贪婪算法
反馈协同机制
-
Keywords
flow-shop scheduling
deep reinforcement learning
iterative greedy method
feedback and collaboration mechanism
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-