-
题名基于多动作深度强化学习的纺机制造车间调度方法
被引量:1
- 1
-
-
作者
纪志勇
袁逸萍
巴智勇
樊盼盼
田芳
-
机构
新疆大学机械工程学院
乌鲁木齐市技术创新研发与科技成果转化中心
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第11期3247-3253,共7页
-
基金
国家自然科学基金资助项目(71961029)
新疆维吾尔自治区重点研发计划资助项目(2020B02013)。
-
文摘
纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模为多马尔可夫决策过程。然后,针对纺机制造车间调度的工件选择和机器选择两个子问题,分别设计了用于定义工序选择策略和机器选择策略的两个编码器,以预测选择不同工序和机器的概率分布。其中,在工序选择编码器中,采用图神经网络对析取图进行编码,以降低问题规模对解的质量的影响。其次,提出了一种具有多动作空间的强化学习训练算法,用于学习两个子策略。最后,经某纺机制造企业的实际生产案例验证,该方法的性能受问题规模影响较小,与其他对比算法相比,能够获得较高质量的调度方案,训练的模型具有较好的泛化能力和稳定性。
-
关键词
纺机制造车间调度
序列相关设置时间
深度强化学习
图神经网络
多近端策略优化算法
最大完工期
-
Keywords
spinning machine manufacturing shop scheduling
sequence-dependent setup time
deep reinforcement learning
graph neural network
multi-proximal policy optimization
maximum completion time
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-