基于深度强化学习的模糊作业车间调度问题被引量：1

Fuzzy job shop scheduling problem based on deep reinforcement learning

导出

摘要针对具有模糊加工时间和模糊交货期的作业车间调度问题,以最小化最大完工时间为目标,以近端策略优化(PPO)算法为基本优化框架,提出一种LSTM-PPO(proximal policy optimization with Long short-term memory)算法进行求解.首先,设计一种新的状态特征对调度问题进行建模,并且依据建模后的状态特征直接对工件工序进行选取,更加贴近实际环境下的调度决策过程;其次,将长短期记忆(LSTM)网络应用于PPO算法的行动者-评论者框架中,以解决传统模型在问题规模发生变化时难以扩展的问题,使智能体能够在工件、工序、机器数目发生变化时,仍然能够获得最终的调度解.在所选取的模糊作业车间调度的问题集上,通过实验验证了该算法能够取得更好的性能. For the job shop scheduling problem with fuzzy processing time and fuzzy delivery time,this paper uses the proximal policy optimization(PPO)algorithm as the basic optimization framework with the objective of minimizing the maximum completion time.An LSTM-PPO(proximal policy optimization with long short-term memory)algorithm is proposed to solve the problem.Firstly,a new state feature is designed to model the scheduling problem,and the process is selected directly based on the modeled state feature,which is closer to the actual scheduling decision process.Them,the long short-term memory(LSTM)network is applied to the actor-commentator framework of the PPO algorithm,which solves the problem that the traditional model is difficult to scale up when the problem size changes,and enables the intelligent body to obtain the final scheduling solution even when the number of workpieces,processes,and machines changes.On the selected problem set of fuzzy job shop scheduling,it is experimentally verified that the algorithm can achieve better performance.

作者朱家政张宏立王聪李新凯董颖超 ZHU Jia-zheng;ZHANG Hong-li;WANG Cong;LI Xin-kai;DONG Ying-chao(College of Electrical Engineering,Xinjiang University,Urumqi 830047,China)

机构地区新疆大学电气工程学院

出处《控制与决策》 EI CSCD 北大核心 2024年第2期595-603,共9页 Control and Decision

基金国家自然科学基金项目(51967019,52065064)。

关键词深度学习强化学习近端策略优化算法模糊作业车间调度 deep learning reinforcement learning proximal policy optimization fuzzy job shop scheduling

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1肖鹏飞,张超勇,孟磊磊,洪辉,戴稳.基于深度强化学习的非置换流水车间调度问题[J].计算机集成制造系统,2021,27(1):192-205. 被引量：29
2王凌,潘子肖.基于深度强化学习与迭代贪婪的流水车间调度优化[J].控制与决策,2021,36(11):2609-2617. 被引量：23
3王凌,郑洁,王晶晶.求解区间数分布式流水线调度的混合离散果蝇优化算法[J].控制与决策,2020,35(4):930-936. 被引量：21
4刘凯,黄辉先,赵骥.求解模糊作业车间调度问题的混沌乌鸦搜索算法[J].传感器与微系统,2021,40(6):110-113. 被引量：4
5李俊青,潘全科.求解模糊作业车间调度问题的混合优化算法[J].机械工程学报,2013,49(23):142-149. 被引量：11

二级参考文献17

1周济.智能制造是“中国制造2025”主攻方向[J].企业观察家,2019,0(11):54-55. 被引量：106
2王凌,郑洁,王晶晶.求解区间数分布式流水线调度的混合离散果蝇优化算法[J].控制与决策,2020,35(4):930-936. 被引量：21
3宋晓宇,朱云龙,尹朝万,李富明.应用混合蚁群算法求解模糊作业车间调度问题[J].计算机集成制造系统,2007,13(1):105-109. 被引量：15
4李俊青,潘全科,王玉亭.多目标柔性车间调度的Pareto混合禁忌搜索算法[J].计算机集成制造系统,2010,16(7):1419-1426. 被引量：40
5潘全科,王凌,高亮,桑红燕.基于差分进化与块结构邻域的作业车间调度优化[J].机械工程学报,2010,46(22):182-188. 被引量：24
6宋存利,刘晓冰,王伟.大规模无等待流水调度问题的邻域迭代搜索算法[J].控制与决策,2011,26(4):535-539. 被引量：7
7郑友莲,李元香,雷德明.求解模糊作业车间调度问题的群体邻域搜索算法[J].电子学报,2011,39(10):2454-2458. 被引量：1
8王圣尧,王凌,许烨,周刚.求解混合流水车间调度问题的分布估计算法[J].自动化学报,2012,38(3):437-443. 被引量：75
9许鹏飞,苗启广,李伟生,张军英.基于函数复杂度的自适应模拟退火和禁忌搜索新算法[J].电子学报,2012,40(6):1218-1222. 被引量：18
10王友钊,彭宇翔,潘芬兰.基于贪心算法和遗传算法的仓储车辆调度算法[J].传感器与微系统,2012,31(10):125-128. 被引量：22

共引文献76

1李丹,向凤红.基于多层编码遗传算法优化模糊FJSP[J].电子测量技术,2020(8):33-37. 被引量：1
2曹红倩.应用改进Q-learning算法解决柔性作业车间调度问题[J].国外电子测量技术,2022,41(4):164-169. 被引量：3
3廖珊,翟所霞,鲁玉军.基于改进遗传算法的柔性作业车间调度方法研究[J].机电工程,2014,31(6):729-733. 被引量：10
4巴黎,李言,杨明顺,刘永,高新勤.考虑不确定加工时间的工艺规划与调度集成问题研究[J].中国机械工程,2015,26(24):3348-3355. 被引量：5
5赵诗奎,王林瑞,石飞.作业车间调度问题综述[J].济南大学学报（自然科学版）,2016,30(1):74-80. 被引量：12
6彭运芳,高雅,夏蓓鑫.不确定条件下基于遗传算法的作业车间调度问题[J].上海大学学报（自然科学版）,2016,22(6):793-803. 被引量：11
7赵晓飞,郭秀萍.求解机器人制造单元调度问题的化学反应优化算法[J].运筹与管理,2017,26(6):35-40. 被引量：3
8李俊青,陈星睿,李文涵,李庆华.混合可再生能源系统优化设计综述[J].山东师范大学学报（自然科学版）,2020,35(3):265-273.
9李俊青,李文涵,陶昕瑞,杜宇,韩玉艳,潘全科.时间约束混合流水车间调度问题综述[J].控制理论与应用,2020,37(11):2273-2290. 被引量：10
10张水平,王丽娜.果蝇优化算法的进展研究分析[J].计算机工程与应用,2021,57(6):22-29. 被引量：11

同被引文献10

1周康渠,赵慧真.混合离散粒子群算法在混流装配线生产调度中的应用[J].重庆理工大学学报（自然科学）,2015,29(3):58-64. 被引量：5
2赵诗奎.柔性作业车间调度的改进邻域结构混合算法[J].计算机集成制造系统,2018,24(12):3060-3072. 被引量：25
3郭伟飞,宋豫川,周璠,雷琦,吕向飞.基于逆序虚拟零部件的紧密衔接综合调度算法[J].计算机集成制造系统,2020,26(12):3313-3328. 被引量：3
4杨晋渝.汽车生产线自动调度系统设计[J].自动化与仪器仪表,2021(9):100-104. 被引量：2
5刘凤杰,薛仁政.混合粒子群算法求解作业车间调度问题[J].高师理科学刊,2022,42(6):38-43. 被引量：2
6吴晓雯,郑巧仙.基于改进粒子群的柔性作业车间调度问题优化研究[J].湖北大学学报（自然科学版）,2022,44(5):501-507. 被引量：4
7李晨,吉桐萱.基于改进启发式--遗传算法的流水车间调度问题研究[J].中国新通信,2022,24(14):119-121. 被引量：2
8王柏村,朱凯凌,鲍劲松,王峰,谢海波,杨华勇.基于数字底座的涂装车身缓存区智能设计与调度优化[J].工程设计学报,2023,30(4):399-408. 被引量：1
9刘恒,张亚加,邵乐乐,邵建龙.汽车制造缓存区调度优化研究[J].陕西理工大学学报（自然科学版）,2023,39(6):55-61. 被引量：1
10屈国际,李震领,鄢冰.基于改进遗传粒子群结合算法的智能化检修配调优化设计[J].粘接,2023,50(12):183-187. 被引量：1

引证文献1

1王恒,唐孝国.汽车制造涂装-总装缓存调序区调度优化问题的研究[J].智能计算机与应用,2024,14(4):89-95.

1刘凯,黄辉先,赵骥.求解模糊作业车间调度问题的混沌乌鸦搜索算法[J].传感器与微系统,2021,40(6):110-113. 被引量：4
2袁源.智能电网技术在电力系统调度中的实践[J].模具制造,2024,24(3):206-208. 被引量：1
3郑怡昕,王重仁.基于Optuna框架的L_(p)范数约束下多核支持向量机在违约风险预测中的应用[J].现代电子技术,2024,47(6):147-153.
4杨希,王刚,张鹏宇,李颖,张国锋.售电侧开放市场环境下基于多分位鲁棒极限学习机的短期负荷预测技术[J].科技创新与应用,2024,14(8):94-97.
5李进新.柔性棒材轧线批量与调度智能化方法研究[J].中国物流与采购,2024(4):47-48.
6蒋采钰.全球金融周期与我国股市波动率预测研究——来自GARCH-MIDAS模型的证据[J].金融发展评论,2023(11):1-17. 被引量：1
7罗哲,杨志锋,李玲香,夏余平,李建杰.基于多层编码遗传算法的车间调度问题研究[J].自动化应用,2024,65(3):223-225.
8徐慧慧,田云飞,赵宇洋,柴宜,方茜,梁宁.考虑绿证-碳交易的多虚拟电厂混合博弈优化调度[J].智慧电力,2024,52(3):1-7. 被引量：1
9刘慧,徐志涛,陈文飞,胡泽儒.面向低碳排放的航空零件柔性作业车间调度优化[J].航空科学技术,2024,35(2):47-57.
10彭茂峰,宋光雄,祁湛桐,段彩丽.基于EMD-SE-LSTM模型的火电机组振动预测[J].电力大数据,2023,26(12):28-36.

控制与决策

2024年第2期

浏览历史

内容加载中请稍等...

基于深度强化学习的模糊作业车间调度问题被引量：1

参考文献5

二级参考文献17

共引文献76

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的模糊作业车间调度问题 被引量：1

参考文献5

二级参考文献17

共引文献76

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的模糊作业车间调度问题被引量：1