深度强化学习求解柔性装配作业车间调度问题被引量：2

Deep reinforcement learning for flexible assembly job shop scheduling problem

导出

摘要针对产品动态到达的柔性装配作业车间调度问题,以最小化总拖期为目标,构建了基于事件点的数学规划模型,该模型包含加工机器分配、加工工序排序、装配站分配和装配工序排序四个决策序列,并提出了一种基于多智能体的深度强化学习算法进行求解.首先,所提出的算法包含四个智能体分别对应四个决策序列,智能体之间采用价值分解网络(VDN)协作策略;然后,构建基于拖期的复合回报函数,提取生产系统指标作为全局特征,完善各智能体的调度动作;最后,设计了精英经验库,充分挖掘高回报样本的价值.案例结果表明所提出的方法在不同场景下都优于现有经典调度规则和元启发式算法挖掘的调度规则. The flexible assembly job shop scheduling problem with dynamic products arrival was addressed,to minimize total tardiness.A mathematical programming model was proposed based on event points,which contains four decision-making sequences:processing machine assignment,processing operation sequence,assembly station assignment,and assembly operation sequence.This model was solved by deep reinforcement learning algorithm based multi-agent.Firstly,the proposed algorithm consisted of four agents corresponding to four decision sequences,and multi-agent adopted a value decomposition networks(VDN)based cooperative strategy.Secondly,the reward function with tardiness was designed,the digital features of production system were extracted as global features,and the scheduling actions of each agent were defined.Finally,an elite experience pool was designed to fully exploit the value of high return samples.The experimental results show that the proposed method is superior to both classical heuristic rules and meta-heuristic rules in different scenarios.

作者胡一凡张利平白雪唐秋华 HU Yifan;ZHANG Liping;BAI Xue;Tang Qiuhua(Key Laboratory of Metallurgical Equipment and Control Technology,Ministry of Education,Wuhan University of Science and Technology,Wuhan 430081,China;Hubei Key Laboratory of Mechanical Transmission and Manufacturing Engineering,Wuhan University of Science and Technology,Wuhan 430081,China;Evergrande School of Management,Wuhan University of Science and Technology,Wuhan 430081,China)

机构地区武汉科技大学冶金装备及其控制教育部重点实验室武汉科技大学机械传动与制造工程湖北省重点实验室武汉科技大学恒大管理学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2023年第2期153-160,共8页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家自然科学基金面上项目(51875420,51875421)。

关键词柔性装配车间调度工件动态到达多智能体深度强化学习 flexible assembly job shop scheduling job dynamic arrival multi-agent deep reinforcement learning

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1吕海利,朱家涛,王正国,吴姝.装配作业车间的JIT调度研究[J].机械工程学报,2021,57(5):157-165. 被引量：8
2范华丽,熊禾根,蒋国璋,李公法.动态车间作业调度问题中调度规则算法研究综述[J].计算机应用研究,2016,33(3):648-653. 被引量：25
3李凯文,张涛,王锐,覃伟健,贺惠晖,黄鸿.基于深度强化学习的组合优化研究进展[J].自动化学报,2021,47(11):2521-2537. 被引量：39
4孔松涛,刘池池,史勇,谢义,王堃.深度强化学习在智能制造中的应用展望综述[J].计算机工程与应用,2021,57(2):49-59. 被引量：15
5肖鹏飞,张超勇,孟磊磊,洪辉,戴稳.基于深度强化学习的非置换流水车间调度问题[J].计算机集成制造系统,2021,27(1):192-205. 被引量：29
6林时敬,徐安军,刘成,冯凯,李稷.基于深度强化学习的炼钢车间天车调度方法[J].中国冶金,2021,31(3):37-43. 被引量：7

二级参考文献67

1臧雪松,徐安军,李稷,宋伟.炼钢-连铸区段天车调度的多目标建模与求解[J].中国冶金,2020,0(2):68-73. 被引量：5
2庞新富,刘炜,李海波,马艺骅,程宇翔,陈阳春.炼钢—连铸生产过程运输设备天车调度方法[J].信息与控制,2019,48(6):745-753. 被引量：9
3孙波,陈卫东,席裕庚.基于粒子群优化算法的移动机器人全局路径规划[J].控制与决策,2005,20(9):1052-1055. 被引量：79
4熊禾根,李建军,孔建益,杨金堂,蒋国璋.考虑工序相关性的动态Job shop调度问题启发式算法[J].机械工程学报,2006,42(8):50-55. 被引量：33
5刑文训,谢金星.现代优化计算方法[M].北京:清华大学出版社,2001.
6Johnson S M. Optimal two and three-stage production schedules with setup times included[J] . Naval Research Logistics, 1954, 1(1):61-68.
7郑大钟, 赵千川. 离散事件动态系统[M] . 北京:清华大学出版社, 1999.
8Manne A S. On the Job-Shop scheduling problem[J] . Operations Research, 1960, 8(2):219-223.
9Van Hulle M M. A goal programming network for mixed integer linear programming:a case study for the Job-Shop scheduling problem[J] . International Journal of Neural Networks, 1991, 2(3):201-209.
10Balas E. Machine scheduling via disjunctive graphs:an implicit enumeration algorithm[J] . Operations Research, 1969, 17(6):941-957.

共引文献113

1曹红倩.应用改进Q-learning算法解决柔性作业车间调度问题[J].国外电子测量技术,2022,41(4):164-169. 被引量：3
2乔东平,裴杰,肖艳秋,周坤.蚁群算法及其应用综述[J].软件导刊,2017,16(12):217-221. 被引量：29
3张春燕.基于改进遗传进化算法的复杂作业流程调度[J].软件,2017,38(12):98-103. 被引量：2
4范华丽,熊禾根,蒋国璋,李公法,李梓响.基于遗传规划的动态作业车间调度规则生成[J].计算机集成制造系统,2018,24(4):876-885. 被引量：14
5王雄伟,陈春良,曹艳华,陈伟龙,吴同晗.考虑优先级的维修任务动态调度方法[J].兵工自动化,2018,37(6):83-87. 被引量：3
6解明利,胡占齐,马宁.基于最大熵神经网络算法的柔性制造系统调度策略研究[J].计算机应用研究,2018,35(12):3697-3700. 被引量：3
7周琪森,林杰,白翱.考虑班组负荷均衡的智能制造车间工序级作业任务排程模型研究[J].制造业自动化,2018,40(3):101-105. 被引量：5
8曾强,邓敬源,常梦辉,张进春.混合工作日历下作业车间调度遗传进化方法[J].中国机械工程,2018,29(22):2690-2702. 被引量：2
9罗弦,廖荣涛,查志勇,王逸兮,焦尧毅.云平台下电力系统能量备用实时调度模型研究[J].电子设计工程,2019,27(2):175-178. 被引量：10
10赵宏涛,许伟,陈峰,王涛.高速铁路列车运行计划自动调整系统研究[J].铁道运输与经济,2019,41(2):59-64. 被引量：10

同被引文献21

1张雪艳,梁工谦,董仲慧.基于改进自适应遗传算法的柔性作业车间调度问题研究[J].机械制造,2016,54(6):1-4. 被引量：7
2罗忠游,李俊庆,孙谊媊,钱晶,于永军.电能质量监测装置自动检测平台研究[J].电气技术,2017,18(5):97-100. 被引量：7
3姜立标,凌诗韵,黄楚然,丘华川.基于LabVIEW的直流充电桩自动检测系统的开发[J].重庆理工大学学报（自然科学）,2017,31(8):7-13. 被引量：7
4朱彬,侯兴哲,孙洪亮,刘永相,汪会财,龙羿.电动汽车充电设施互操作性测试方法研究[J].电测与仪表,2017,54(22):71-76. 被引量：6
5朱彬,侯兴哲,孙洪亮,刘永相,汪会财.电动汽车充电设施自动检测平台设计[J].电测与仪表,2017,54(23):75-80. 被引量：8
6钟劲松,刘卫新,李宁,潘霞,曹威.电动汽车直流充电桩检定系统研制[J].电测与仪表,2018,55(B08):94-97. 被引量：8
7彭乘风,陈庆新,毛宁,黎展滔.具有无序工序生产特征的混合柔性流水车间在线调度[J].计算机集成制造系统,2019,25(11):2775-2787. 被引量：9
8沈成,徐文慧.电动汽车充电桩现场检测方法的探讨[J].四川水泥,2019,0(11):179-179. 被引量：3
9张清勇,孙泽轩,雷德明.分布式两阶段混合流水车间调度[J].华中科技大学学报（自然科学版）,2020,48(4):127-132. 被引量：4
10蔡劲草,雷德明.考虑准备时间的分布式两阶段混合流水车间调度[J].计算机集成制造系统,2020,26(8):2170-2179. 被引量：12

引证文献2

1李晶晶,张永敏,田桂林,崔胜胜,严洁.基于改进遗传算法的充电桩检测调度优化[J].西华大学学报（自然科学版）,2023,42(5):19-27.
2蔡劲草,王雷,雷德明.基于蛙跳算法的分布式装配混合流水车间调度[J].华中科技大学学报（自然科学版）,2023,51(12):37-44.

1天堂有羽.字母、产品树与皮肤“大师”们的决战——2021-2022羽毛球拍年终个人总结[J].羽毛球,2023(1):102-107.
2付广华.拆分、解读与批判:人类世人类学的进路与走向--人类世人类学理论与案例研究之二[J].广西民族研究,2022(5):104-113. 被引量：2
3行业及产品动态[J].聚合物与助剂,2022(6):66-70.
4周健,郑联语,王艺玮,王移川.面向旋转机械迁移诊断的分层并行网络模型自动创建方法[J].机械工程学报,2022,58(22):115-128. 被引量：1
5曾亮,李燕燕,王珊珊,全睿.代理辅助遗传规划调度规则中的特征选择[J].华中科技大学学报（自然科学版）,2023,51(2):139-145.
6王龙平,李妍妍,魏洁,韩流.肱动脉与正中神经解剖关系的超声影像评估及相关因素分析[J].东南大学学报（医学版）,2022,41(6):840-849. 被引量：1
7彭晟远,文静,祁麟.宝钢股份取向硅钢产品产销协同分析及实现[J].电工钢,2023,5(1):6-11.
8王凌,王晶晶.考虑运输时间的分布式绿色柔性作业车间调度协同群智能优化[J].中国科学：技术科学,2023,53(2):243-257. 被引量：12
9孔凡翠.隐匿性乙型肝炎病毒感染血清学指标及分子特征分析[J].中文科技期刊数据库（全文版）医药卫生,2022(10):69-71.
10谢志强,夏迎春.基于遗传算法和分枝定界的多车间空闲产能调度方法[J].机械工程学报,2022,58(22):462-472. 被引量：2

华中科技大学学报（自然科学版）

2023年第2期

浏览历史

内容加载中请稍等...

深度强化学习求解柔性装配作业车间调度问题被引量：2

参考文献6

二级参考文献67

共引文献113

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

深度强化学习求解柔性装配作业车间调度问题 被引量：2

参考文献6

二级参考文献67

共引文献113

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

深度强化学习求解柔性装配作业车间调度问题被引量：2