应用改进Q-learning算法解决柔性作业车间调度问题被引量：3

Application of improved Q-learning algorithm to solve flexible job shop scheduling problem

下载PDF

导出

摘要柔性作业车间调度是目前加工系统中的一个重要调度问题,对于该问题的解决方法大都存在速度较慢等缺陷,提出一种改进的Q-learning算法,设计了动态的状态空间及动作集,通过引入“Sigmoid”函数作为动态选择策略改进Q-learning算法,使改进后的算法前期随机选择动作,后期在随机选择动作和选择奖励值最高的动作中动态变化,有效改善了传统Q-learning算法容易陷入局部最优且收敛速度慢等缺陷。将改进Q-learning算法应用到TSP问题中,证实改进算法的普适性和可行性,再将其应用解决柔性调度问题中,证实了其改进的有效性,提升了解决柔性作业车间调度问题的速度和精度。 Flexible job shop scheduling is an important scheduling problem in the current processing system.Most of the solutions to this problem have problems such as slow speed.This paper proposes an improved Q-learning algorithm and designs a dynamic state space and action set.Improve the Q-learning algorithm by introducing the"Sigmoid"function as a dynamic selection strategy,so that the improved algorithm randomly selects actions in the early stage,and dynamically changes in the later stage of the random selection of actions and the action with the highest reward value,effectively improving the traditional Q-learning algorithm It is easy to fall into defects such as local optimum and slow convergence speed.This article first applies the improved Q-learning algorithm to the TSP problem,confirms the universality and feasibility of the improved algorithm,and then applies it to solve the flexible scheduling problem,confirms the effectiveness of its improvement,and improves the solution to flexible job shop scheduling.The speed and accuracy of the problem.

作者曹红倩 Cao Hongqian(School of Information and Control Engineering,Liaoning Petrochemical University,Fushun 130001,China)

机构地区辽宁石油化工大学信息与控制工程学院

出处《国外电子测量技术》北大核心 2022年第4期164-169,共6页 Foreign Electronic Measurement Technology

基金辽宁省自然科学基金指导计划重点项目(20170540589)资助

关键词 Q-LEARNING 柔性作业车间调度 Q-learning flexibility job shop scheduling

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TH165 [机械工程—机械制造及自动化]

引文网络
相关文献

参考文献14

1罗雄,钱谦,伏云发.无非法解遗传算法求解柔性作业车间调度问题[J].电子测量技术,2020,43(7):36-40. 被引量：3
2张其亮,陈永生.一种新的混合粒子群算法求解置换流水车间调度问题[J].计算机应用研究,2012,29(6):2028-2030. 被引量：8
3刘韵,胡毅,罗企,房超.一种解决柔性车间作业调度问题的粒子群优化算法[J].组合机床与自动化加工技术,2015(12):144-147. 被引量：11
4闫皎洁,张锲石,胡希平.基于强化学习的路径规划技术综述[J].计算机工程,2021,47(10):16-25. 被引量：35
5李国昊,李文超.一种基于Q学习的Flow shop问题调度算法研究[J].工业工程与管理,2016,21(5):23-27. 被引量：3
6肖鹏飞,张超勇,孟磊磊,洪辉,戴稳.基于深度强化学习的非置换流水车间调度问题[J].计算机集成制造系统,2021,27(1):192-205. 被引量：26
7王维祺,叶春明,谭晓军.基于Q学习算法的作业车间动态调度[J].计算机系统应用,2020,29(11):218-226. 被引量：6
8陈亮,阎春平,陈建霖,侯跃辉.基于深度学习神经网络和量子遗传算法的柔性作业车间动态调度[J].重庆大学学报,2022,45(6):40-54. 被引量：4
9魏利胜,王宁.基于新型生物地理学优化算法的作业车间调度研究[J].电子测量与仪器学报,2020,32(3):109-118. 被引量：7
10万里鹏,兰旭光,张翰博,郑南宁.深度强化学习理论及其应用综述[J].模式识别与人工智能,2019,32(1):67-81. 被引量：60

二级参考文献141

1李辉,祁宇明.一种复杂环境下基于深度强化学习的机器人路径规划方法[J].计算机应用研究,2020,37(S01):129-131. 被引量：13
2戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
3江雷.基于并行遗传算法的弹性TSP研究[J].微电子学与计算机,2005,22(8):130-133. 被引量：10
4周涛.基于改进遗传算法的TSP问题研究[J].微电子学与计算机,2006,23(10):104-106. 被引量：19
5Hung Dinh Nguyen, Kunihito Yamamori, Moritoshi Yasunaga, et al. Implementation of an effective hybrid GA for large-scale traveling salesman problems [J]. IEEE Transactions on Systems, Man, And Cybernetics, 2007,37(1) : 92--99.
6Tsai C F, Tsai C W, Tseng C C. A new approach for sovling large traveling salseman problem [ C]// Pro ceedings of the 2002 Congress on Evolutionary Computation. Honolulu, HI: IEEE, 2002(8):1636-1641.
7Firbes J. Burkowski, proximity and priority: applying a gene expression algorithm to the traveling salesperson problem [C]// International Parallel and Distributed Processing Symposium. Nice:IEEE, 2003,30(5): 803 - 816.
8Lin S, Kernighan B W. An effective heuristic algorithm for the traveling-salesman problem[J]. Operations Re search, 1973,21(2) :498-516.
9He Xiaoxian, Zhu Yunlong, Hu Hechun. A new algo rithm for TSP based on swarm intelligence[C]// Proceeding of the 6th World Congress on Intelligent Cont reland Automation. Dalian: IEEE, 2006 :3241 -- 3244.
10GAREY M R, JOHNSON D S, SETHI R. The complexity of flow shop and job shop scheduling[ J]. Mathematics of Operations Research, 1976,1 (2) :117-129.

共引文献187

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2周宏宇,王小刚,赵亚丽,崔乃刚.组合动力运载器上升段轨迹智能优化方法[J].宇航学报,2020,41(1):61-70. 被引量：8
3钟玮琦,喻仁虹,李明柱.基于DDPG算法的供热末端运行策略研究[J].暖通空调,2022,52(S02):170-174.
4王昊,林远山,李然,于红,王芳.面向养殖网箱巡检任务的强化学习训练系统[J].计算机与数字工程,2023,51(1):103-111.
5罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
6邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：1
7王凌浩,舒亮,钱祺.基于断路器柔性装配的移动机器人路径规划[J].电子测量技术,2023,46(5):121-128.
8姚懋欣,刘桂雄,陈国宇.燃气表计量检定线首次检定调度技术研究[J].电子测量技术,2023,46(4):56-59. 被引量：2
9李瑜,张占强,孟克其劳,魏皓天.基于改进深度确定性策略梯度算法的微电网能量优化调度[J].电子测量技术,2023,46(2):73-80. 被引量：2
10闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17

同被引文献28

1王维祺,叶春明,谭晓军.基于Q学习算法的作业车间动态调度[J].计算机系统应用,2020,29(11):218-226. 被引量：6
2顾涛,李苏建,林莹璐,吴秀丽.周期式退火炉作批处理机的可重入批离散机流水车间调度[J].机械工程学报,2020,56(2):220-232. 被引量：8
3周芳芳,樊晓平,叶榛.均值漂移算法的研究与应用[J].控制与决策,2007,22(8):841-847. 被引量：59
4吴秀丽,崔琪.考虑可再生能源的多目标柔性流水车间调度问题[J].计算机集成制造系统,2018,24(11):2792-2807. 被引量：11
5姚远远,叶春明,杨枫.双目标可重入混合流水车间调度问题的离散灰狼优化算法[J].运筹与管理,2019,28(8):190-199. 被引量：18
6赵静,汤云峰,蒋国平,徐丰羽,丁洁.基于改进蚁群算法的移动机器人路径规划[J].南京邮电大学学报（自然科学版）,2019,39(6):73-78. 被引量：48
7耿凯峰,叶春明,吴绍兴,刘丽.分时电价下多目标绿色可重入混合流水车间调度[J].中国机械工程,2020,31(12):1469-1480. 被引量：9
8拜颖乾,高攀科,任锐.盾构机推进液压系统仿真控制研究[J].现代制造工程,2020(9):128-135. 被引量：5
9刘肖楠,马龙华.基于PSO-PID的盾构机纠偏控制研究[J].计算机测量与控制,2020,28(9):122-126. 被引量：3
10杨能俊,郭宇,方伟光,黄少华,吴鹏兴.实时数据驱动的离散制造车间自适应调度方法[J].组合机床与自动化加工技术,2020(9):175-179. 被引量：4

引证文献3

1刘礼,刘勇,孙云权,郭涛.基于自适应蚁群算法的AGV路径规划优化[J].电子测量技术,2023,46(18):100-107.
2吴秀丽,闫晓燕.基于改进Q学习的可重入混合流水车间绿色动态调度[J].机械工程学报,2023,59(13):246-259. 被引量：1
3赵文佳,石小伟,赵茜,杨璐,张艳丽,张亦敏.基于强化学习的盾构抗扰纠偏控制研究[J].隧道建设（中英文）,2024,44(2):282-287.

二级引证文献1

1周华锋,胡荣,聂涌泉,李金,马光,黄俊聪,左嘉志.考虑碳排放的智慧园区配电网协同调度优化策略[J].供用电,2023,40(10):73-80. 被引量：1

1还婧文,杨少石,袁田浩,孟阔,毕嘉辉,唐玉蓉.一类基于定向Q-Learning的后5G无线网络上下行多业务并发功率分配方法[J].中国传媒大学学报（自然科学版）,2022,29(2):27-33.
2杨敏,李宏伟,任怡凤,张聪伟.基于旅客异质性画像的公铁联程出行方案推荐方法[J].清华大学学报（自然科学版）,2022,62(7):1220-1227. 被引量：5
3刘艳琪,刘一杰.基于病毒侵染和逆转操作的改进遗传算法[J].湖南文理学院学报（自然科学版）,2022,34(3):23-29. 被引量：2
4樊志领,郭东威,陈娜,刘伟.阴阳对优化算法在旅行商问题中的推广与应用[J].周口师范学院学报,2022,39(2):6-12.
5程鑫,张帆,同军超,张卫超.多目标多障碍路径规划的改进蚁群算法研究[J].数字制造科学,2022(1):1-6.
6吴焱明,曹宁,李飞亚,李昂.基于贪心算法的板材多孔加工路径优化算法研究[J].合肥工业大学学报（自然科学版）,2022,45(6):742-745. 被引量：2
7王雨虹,王志中,付华,王淑月,王留洋.多策略改进麻雀算法与BiLSTM的变压器故障诊断研究[J].仪器仪表学报,2022,43(3):87-97. 被引量：34
8刘艺凡,田雨波.基于万有引力搜索算法极限学习机的谐振频率建模[J].江苏科技大学学报（自然科学版）,2022,36(2):73-79. 被引量：2
9Bingjie Xi,Deming Lei.Q-Learning-Based Teaching-Learning Optimization for Distributed Two-Stage Hybrid Flow Shop Scheduling with Fuzzy Processing Time[J].Complex System Modeling and Simulation,2022,2(2):113-129. 被引量：1
10李慧敏,顾海波.利用模糊Laplace变换的方法求解模糊分数阶积分微分方程[J].滨州学院学报,2022,38(4):56-63. 被引量：1

国外电子测量技术

2022年第4期

浏览历史

内容加载中请稍等...

应用改进Q-learning算法解决柔性作业车间调度问题被引量：3

参考文献14

二级参考文献141

共引文献187

同被引文献28

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

应用改进Q-learning算法解决柔性作业车间调度问题 被引量：3

参考文献14

二级参考文献141

共引文献187

同被引文献28

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

应用改进Q-learning算法解决柔性作业车间调度问题被引量：3