基于强化学习的晶圆炉管区设备维护调度联合优化方法

Reinforcement learning based joint optimization method for equipment maintenance scheduling in wafer furnace tube

下载PDF

导出

摘要针对晶圆炉管区加工过程中晶圆动态到达、不同工艺类型晶圆不相容和设备预测性维护等问题,以最小化最大完工时间和总拖期为目标,考虑炉管区组批、设备维护选择和批次排序,构建炉管区设备维护-调度联合优化的数学模型。提出基于多目标近端策略优化(MPPO)强化学习的实时调度优化方法。设计组批智能体,根据动态到达的晶圆信息,实现相同工艺类型晶圆的组批;设计设备智能体,根据设备的预维护区间,提出一种预维护区间维护调度联合优化策略,依据该优化策略维护设备并确定维护开始时间;设计排序智能体,根据批次的紧急程度和晶圆不同层尽量在同一设备加工的约束,进行批次排序加工决策。引入长短期记忆网络(LSTM)对炉管区调度信息进行记忆和预测,排序智能体进行排序时,读取组批和设备智能体的决策,并将晶圆加工结束时间反馈给组批和设备智能体,实现智能体之间的交互。根据企业实际生产情况进行案例设计,并与其他算法进行比较,验证了所提MPPO算法的有效性,其具有良好的综合调度性能。 Aiming at the problems such as dynamic wafer arrival,wafer incompatibility of different process types and predictive maintenance,a mathematical model for joint optimization of equipment maintenance scheduling in furnace tube area is constructed by considering furnace tube area group batch,equipment maintenance selection and batch sequencing.A real-time scheduling optimization method based on multi-objective proximal policy optimization(MPPO)reinforcement learning is proposed.The batch agent is designed to realize the same process type of wafer batch according to the dynamic arrival of wafer information.The equipment agent is designed and a joint optimization strategy of maintenance scheduling in the pre-maintenance interval was proposed according to the pre-maintenance interval of the equipment,and then maintain the equipment and determine the maintenance start time based on the optimization strategy.The sequencing agent is designed to make batch sequencing processing decisions based on the urgency of batch and the constraint of processing the wafers of different layers in the same equipment as far as possible.The long short-term memory(LSTM)network is introduced to memorize and predict the scheduling information of the furnace tube area.The sequencing agent reads the decision of the batch agent and equipment agent,and then feeds the end time of wafer processing to the batch agent and equipment agent so as to realize the interaction between the agents.According to the actual production situation of the enterprise,the case design and comparison with other algorithms verify the effectiveness of the proposed MPPO algorithm,which has good comprehensive scheduling performance and can optimize all targets.

作者周亚勤刘一枫张朋张洁 ZHOU Yaqin;LIU Yifeng;ZHANG Peng;ZHANG Jie(College of Mechanical Engineering,Donghua University,Shanghai,China;Artificial Intelligence Research Institute,Donghua University,Shanghai,China)

机构地区东华大学机械工程学院东华大学人工智能研究院

出处《东华大学学报（自然科学版）》 CAS 北大核心 2024年第6期65-74,共10页 Journal of Donghua University(Natural Science)

基金国家重点研发计划(2022YFB3305003)。

关键词强化学习炉管区设备预维护批处理设备多目标优化 reinforcement learning furnace tube equipment pre-maintenance batch processing equipment multi-objective optimization

分类号 TH166 [机械工程—机械制造及自动化]

引文网络
相关文献

参考文献5

1顾涛,李苏建,林莹璐,吴秀丽.周期式退火炉作批处理机的可重入批离散机流水车间调度[J].机械工程学报,2020,56(2):220-232. 被引量：11
2刘琼,刘嘉豪,刘佳良.基于改进人工蜂群算法的预防性维修与柔性作业车间成组调度集成优化[J].机械工程学报,2023,59(12):89-96. 被引量：2
3顾文斌,李育鑫,刘斯麒,苑明海,裴凤雀.数据驱动的智慧车间实时调度方法研究[J].机械工程学报,2023,59(12):47-61. 被引量：2
4王卓君,张朋,张洁.结合逆向强化学习与强化学习的晶圆批处理设备调度方法[J].计算机集成制造系统,2023,29(11):3738-3749. 被引量：1
5蒋小康,张朋,吕佑龙,赵新明,张洁.基于混合蚁群算法的半导体生产线炉管区调度方法[J].上海交通大学学报,2020,54(8):792-804. 被引量：6

二级参考文献21

1SIA发布美国半导体制造业竞争力研究报告[J].国防制造技术,2020(3):28-29. 被引量：1
2赵玉芳,唐立新.极小化最大完工时间的单机连续型批调度问题[J].自动化学报,2006,32(5):730-737. 被引量：18
3邓可,林杰,张鹏.基于蚁群算法的半导体生产线调度方法研究[J].计算机工程与应用,2009,45(12):198-201. 被引量：4
4陈晓慧,张启忠,易树平,段鹰,赖志柱.基于遗传算法的可重入钢管生产优化调度[J].北京科技大学学报,2009,31(8):1067-1071. 被引量：4
5陈民铀,张聪誉,罗辞勇.自适应进化多目标粒子群优化算法[J].控制与决策,2009,24(12):1851-1855. 被引量：54
6郭乘涛,江志斌.应用混合蚁群算法求解并行批处理机组批与调度问题[J].上海交通大学学报,2010,44(8):1068-1073. 被引量：9
7轩华.含串行批处理机的三阶段混合流水车间调度问题[J].计算机集成制造系统,2012,18(5):1006-1010. 被引量：7
8李程,江志斌,李友,李娜,耿娜,姚世清,贾文友.基于规则的批处理设备调度方法在半导体晶圆制造系统中应用[J].上海交通大学学报,2013,47(2):230-235. 被引量：6
9张洁,张朋,刘国宝.基于两阶段蚁群算法的带非等效并行机的作业车间调度[J].机械工程学报,2013,49(6):136-144. 被引量：36
10李耀宇,朱一凡,杨峰,贾全.基于逆向强化学习的舰载机甲板调度优化方案生成方法[J].国防科技大学学报,2013,35(4):171-175. 被引量：20

共引文献17

1谢志强,吕妮.存在预启动设备的综合调度算法[J].机械工程学报,2021,57(17):217-225. 被引量：2
2黄祎轶,刘君强.基于广义随机Petri网的机场滑行道风险研究[J].航空计算技术,2022,52(1):55-59. 被引量：3
3牟健慧,段培永,高亮,彭武良,丛建臣.基于混合遗传算法求解分布式流水车间逆调度问题[J].机械工程学报,2022,58(6):295-308. 被引量：11
4唐文娜,刘乐.转包商选择与单机批调度联合优化[J].计算机系统应用,2022,31(9):342-351. 被引量：1
5刘亚辉,申兴旺,顾星海,彭涛,鲍劲松,张丹.面向柔性作业车间动态调度的双系统强化学习方法[J].上海交通大学学报,2022,56(9):1262-1275. 被引量：8
6吴秀丽,曹铮.带连续式批处理机的可重入混合流水车间调度[J].计算机集成制造系统,2022,28(11):3365-3378. 被引量：3
7刘晓明,姜文涛,张煦松,陈海,韩旭.考虑公差不确定性的快速真空开关机构保持单元多目标优化[J].机械工程学报,2022,58(17):58-66. 被引量：1
8臧谦,贾伯岩,范辉,李秉宇,马天祥,张鹏,刘晓明.基于磁场与电弧互作的真空断路器触头结构设计[J].高压电器,2022,58(12):42-48. 被引量：4
9吴秀丽,闫晓燕.基于改进Q学习的可重入混合流水车间绿色动态调度[J].机械工程学报,2023,59(13):246-259. 被引量：5
10王卓君,张朋,张洁.结合逆向强化学习与强化学习的晶圆批处理设备调度方法[J].计算机集成制造系统,2023,29(11):3738-3749. 被引量：1

1王卓君,张朋,张洁.结合逆向强化学习与强化学习的晶圆批处理设备调度方法[J].计算机集成制造系统,2023,29(11):3738-3749. 被引量：1
2由春辉.基于策略梯度算法的工业数据中心通信调度性能评估[J].现代工业经济和信息化,2024,14(9):122-123.
3吴雪花.广西民族传统工艺创新路径探索[J].中国民族博览,2024(17):51-53.
4朱纯,郑伟华,王玖凯,张文,朱军.基于语义概率图与关联规则的基建工程知识库构建[J].微型电脑应用,2024,40(10):148-151.
5丁瑾,张佳.基于光伏发电的多目标电力系统优化调度模型[J].电力系统装备,2024(10):29-31.

东华大学学报（自然科学版）

2024年第6期

浏览历史

内容加载中请稍等...

基于强化学习的晶圆炉管区设备维护调度联合优化方法

参考文献5

二级参考文献21

共引文献17

相关作者

相关机构

相关主题

浏览历史