期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多动作深度强化学习的纺机制造车间调度方法 被引量:1
1
作者 纪志勇 袁逸萍 +2 位作者 巴智勇 樊盼盼 田芳 《计算机应用研究》 CSCD 北大核心 2023年第11期3247-3253,共7页
纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模... 纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模为多马尔可夫决策过程。然后,针对纺机制造车间调度的工件选择和机器选择两个子问题,分别设计了用于定义工序选择策略和机器选择策略的两个编码器,以预测选择不同工序和机器的概率分布。其中,在工序选择编码器中,采用图神经网络对析取图进行编码,以降低问题规模对解的质量的影响。其次,提出了一种具有多动作空间的强化学习训练算法,用于学习两个子策略。最后,经某纺机制造企业的实际生产案例验证,该方法的性能受问题规模影响较小,与其他对比算法相比,能够获得较高质量的调度方案,训练的模型具有较好的泛化能力和稳定性。 展开更多
关键词 纺机制造车间调度 序列相关设置时间 深度强化学习 图神经网络 多近端策略优化算法 最大完工期
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部