基于强化学习的超启发算法求解有容量车辆路径问题被引量：11

Hyper-heuristic for CVRP with reinforcement learning

下载PDF

导出

摘要为了更高效地求解物流优化领域中的有容量车辆路径问题,减少陷入局部最优的情况,提出一种基于强化学习的超启发算法。设计了算法的高层启发式策略,包括选择策略和解的接受准则:基于学习机制,使用强化学习中的深度Q神经网络算法构造该算法的选择策略,对底层算子的性能进行奖惩评价;利用奖惩值以及模拟退火作为算法的接受准则,对优质解建立序列池,从而引导算法更有效地搜索解空间,并采用聚类思想提升初始解的质量。对有容量车辆问题的标准算例进行计算,并与其他算法对比,统计分析了最优值、误差率和平均值,实验结果表明了所提算法在该问题求解上的有效性和稳定性,总体求解效果优于对比算法。 To reduce the situation of falling into local optimum and solve the capacitated vehicle routing problem,a hyper-heuristic algorithm based on reinforcement learning was.A high-level heuristic strategy was designed,which included selection strategy and acceptance criteria.Based on the learning mechanism,the deep Q neural network algorithm in reinforcement learning was used to construct the selection strategy,and evaluate the performance of the underlying operator with rewards and punishments;Rewards and punishments as well as simulated annealing was used as the acceptance criteria,and a sequence pool was constructed for high-quality solutions,so as to guide the algorithm searching effectively.Also,the clustering method was used to improve the quality of the initial solution.The optimal value was analyzed,error rate and average value were compared with other algorithms.The experimental results show that the proposed algorithm was effect and stable in solving the problem,and the overall solution effect was better than the comparison algorithm.

作者张景玲冯勤炳赵燕伟刘金龙冷龙龙 ZHANG Jingling;FENG Qinbing;ZHAO Yanwei;LIU Jinlong;LENG Longlong(Key Laboratory of Special Equipment Manufacturing and Advanced Processing Technology,Ministry of Education,Zhejiang University of Technology,Hangzhou 310014,China)

机构地区浙江工业大学特种装备制造与先进加工技术教育部重点实验室

出处《计算机集成制造系统》 EI CSCD 北大核心 2020年第4期1118-1129,共12页 Computer Integrated Manufacturing Systems

基金国家自然科学基金资助项目(61402409) 浙江省自然科学基金资助项目(LY19F030017)。

关键词车辆路径问题强化学习深度Q神经网络超启发算法 vehicle routing problem reinforcement learning deep Q neural network hyper-heuristic algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构] U116.2 [交通运输工程]

引文网络
相关文献

参考文献5

1李阳,范厚明.求解带容量约束车辆路径问题的混合变邻域生物共栖搜索算法[J].控制与决策,2018,33(7):1190-1198. 被引量：25
2冷龙龙,赵燕伟,蒋海青,张春苗,王舜.求解物流配送同时取送货低碳选址—路径问题的量子超启发式算法[J].计算机集成制造系统,2020,26(3):815-828. 被引量：10
3曹高立,胡蓉,钱斌,吴丽萍.一种有效混合量子进化算法求解带容量约束的车辆路径优化问题[J].计算机集成制造系统,2015,21(4):1101-1113. 被引量：18
4赵燕伟,彭典军,张景玲,吴斌.有能力约束车辆路径问题的量子进化算法[J].系统工程理论与实践,2009,29(2):159-166. 被引量：41
5张景玲,刘金龙,赵燕伟,王宏伟,冷龙龙,冯勤炳.时间依赖型同时取送货VRP及超启发式算法[J].计算机集成制造系统,2020,26(7):1905-1917. 被引量：19

二级参考文献29

1赵燕伟,彭典军,张景玲,吴斌.有能力约束车辆路径问题的量子进化算法[J].系统工程理论与实践,2009,29(2):159-166. 被引量：41
2肖健梅,黄有方,李军军,王锡淮.基于离散微粒群优化的物流配送车辆路径问题[J].系统工程,2005,23(4):97-100. 被引量：25
3李斌,谭立湘,邹谊,庄镇泉.量子概率编码遗传算法及其应用[J].电子与信息学报,2005,27(5):805-810. 被引量：19
4罗先国,侍洪波.非满载车辆路径问题的改进粒子群优化算法[J].华东理工大学学报（自然科学版）,2006,32(7):767-771. 被引量：4
5姜昌华,戴树贵,胡幼华.求解车辆路径问题的混合遗传算法[J].计算机集成制造系统,2007,13(10):2047-2052. 被引量：33
6Jens Lysgaard,Adam N. Letchford,Richard W. Eglese. A new branch-and-cut algorithm for the capacitated vehicle routing problem[J] 2004,Mathematical Programming(2):423～445
7高辉,徐光辉,王哲人.改进量子进化算法及其在物流配送路径优化问题中的应用[J].控制理论与应用,2007,24(6):969-972. 被引量：19
8DORRONSORO B, ARIAS D, LUNA F, et al. A grid-based hybrid cellular genetic algorithm for very large scale instances of the CVRP FEB/OLd. 2013-11-23. http://www, scs-eu- rope. net/conf/ecms2007/ecms2007-cd/ecms2007/ecms2007 20pdf/hpc_PGC-04. pdf.
9YU B, YANG Z Z, YAO B. An improved ant colony optimi- zation for vehicle routing problem[J]. European Journal of Operational Research, 2009,196 ( 1 ) : 171-176.
10WANG C H, LU J Z. A hybrid genetic algorithm that optimi- zes eapacitated vehicle routing problems[J]. Expert Systems with Applications, 2009,36(2) : 2921-2936.

共引文献101

1陈鑫,吴佳宇,吴雪,张敏霞,郑宇军.社区疫情排查的智能优化调度方法[J].智能科学与技术学报,2020(2):126-134. 被引量：1
2赵燕伟,冷龙龙,王舜,张春苗.进化式超启发算法求解多车型低碳选址-路径问题[J].控制与决策,2020,35(2):257-271. 被引量：5
3方冬云.图论在旅游线路选择中的应用[J].长春工业大学学报,2009,30(5):582-586. 被引量：8
4张景玲,赵燕伟,王海燕,介婧,王万良.多车型动态需求车辆路径问题建模及优化[J].计算机集成制造系统,2010,16(3):543-550. 被引量：53
5汪安静,龚本刚.基于C-W算法的汽车零部件循环取货车辆路径优化研究[J].安徽工程科技学院学报（自然科学版）,2010,25(2):91-94. 被引量：6
6葛显龙,王旭,代应.基于改进遗传算法的有时间窗车辆调度问题研究[J].计算机应用研究,2011,28(2):445-447. 被引量：11
7王翊,范兴刚,王万良,姚晓敏.基于混合量子进化算法的高效节能无线传感器网络路由算法[J].传感技术学报,2011,24(2):253-258. 被引量：5
8王万良,黄海鹏,赵燕伟,张景玲.基于车辆共享的软时间窗动态需求车辆路径问题[J].计算机集成制造系统,2011,17(5):1056-1063. 被引量：44
9梁勤欧.基于改进免疫算法的有能力约束车辆路径问题[J].武汉理工大学学报（信息与管理工程版）,2011,33(5):763-766. 被引量：1
10王旭,葛显龙,代应.基于两阶段求解算法的动态车辆调度问题研究[J].控制与决策,2012,27(2):175-181. 被引量：25

同被引文献102

1孟陆,刘凤军,陈斯允,段珅.我可以唤起你吗——不同类型直播网红信息源特性对消费者购买意愿的影响机制研究[J].南开管理评论,2020,0(1):131-143. 被引量：272
2赵燕伟,冷龙龙,王舜,张春苗.进化式超启发算法求解多车型低碳选址-路径问题[J].控制与决策,2020,35(2):257-271. 被引量：5
3唐国兰,唐成华,吴云忠.车间生产计划动态调整应用研究[J].机电工程技术,2004,33(8):92-94. 被引量：3
4崔建双,李铁克,张文新.混合流水车间调度模型及其遗传算法[J].北京科技大学学报,2005,27(5):623-626. 被引量：29
5CHEN Ai-ling YANG Gen-ke WU Zhi-ming.Hybrid discrete particle swarm optimization algorithm for capacitated vehicle routing problem[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(4):607-614. 被引量：26
6陈娟,徐立鸿.动态小生境遗传算法在多模函数优化中的应用[J].同济大学学报（自然科学版）,2006,34(5):684-688. 被引量：7
7席裕庚,柴天佑,恽为民.遗传算法综述[J].控制理论与应用,1996,13(6):697-708. 被引量：347
8孙华丽,谢剑英.基于暂态混沌神经网络的多车调度混合优化算法[J].控制与决策,2007,22(1):105-108. 被引量：3
9姜昌华,戴树贵,胡幼华.求解车辆路径问题的混合遗传算法[J].计算机集成制造系统,2007,13(10):2047-2052. 被引量：33
10严浩云,李宏余.基于面向负荷的生产控制的紧急订单插单问题[J].计算机集成制造系统,2009,15(9):1809-1815. 被引量：13

引证文献11

1周双牛,李稚,王喆.低碳视角下改进DMBSO算法的垃圾收运路径优化[J].科学技术与工程,2021,21(23):9932-9939. 被引量：9
2冯春,张祎伟,黄成,姜文彪,武之炜.双足机器人步态控制的深度强化学习方法[J].计算机集成制造系统,2021,27(8):2341-2349. 被引量：8
3李珺,郝丽艳,何奕涛,段钰蓉.求解带时间窗车辆路径优化问题的改进细菌觅食算法[J].计算机工程,2021,47(11):44-53. 被引量：8
4崔建双,吕玥,徐子涵.基于Q—学习的超启发式模型及算法求解多模式资源约束项目调度问题[J].计算机集成制造系统,2022,28(5):1472-1481. 被引量：3
5周晓婷,吴禄彬,章宇,姜善成.基于不确定需求的无人驾驶出租车优化调度[J].计算机集成制造系统,2022,28(11):3433-3442. 被引量：1
6彭大江,叶春明,万孟然.基于模糊需求的应急物资中心选址-路径问题的算法研究[J].计算机应用研究,2022,39(12):3631-3638. 被引量：6
7谢世鑫,王旭,杜建辉,钟健,刘培基.考虑同城配送的多产品多中心两级物流网络设计及车辆路径研究[J].管理工程学报,2023,37(3):178-190. 被引量：3
8林剑,叶璟轩,刘雯雯,邵晓雯.求解带容量约束车辆路径问题的多模态差分进化算法[J].计算机应用,2023,43(7):2248-2254. 被引量：2
9刘思宇,李铁克,王柏琳,袁帅鹏,张文新.混合流水车间插单重调度的超启发式遗传算法[J].计算机应用研究,2023,40(9):2609-2615. 被引量：2
10郭玉洁,徐洪智.基于离散哈里斯鹰算法求解车辆路径问题[J].计算机工程与设计,2024,45(6):1764-1770.

二级引证文献42

1沈建刚,郭志义,王啸.基于GIS考虑居民满意度的垃圾车路径优化分析[J].交通与运输,2022,38(2):22-27.
2宋容.基于大数据聚类分析的爬壁机器人位姿定位控制系统设计[J].计算机测量与控制,2022,30(8):96-102. 被引量：1
3高俊晓.智慧校园导向标识机器人步态自动化控制方法[J].自动化与仪器仪表,2022(8):249-252.
4路雪刚,张雪花,张梦桃.基于改进鲸鱼优化算法的畜禽废弃物运输路径优化问题[J].科学技术与工程,2022,22(25):11120-11129. 被引量：7
5闫芳,邓德萍,柴福良.基于智能垃圾桶的垃圾分类动态收运路径优化问题研究[J].计算机应用研究,2022,39(12):3620-3625. 被引量：3
6刘华,武峰.基于混合遗传算法的城市固体废弃物运输路径优化研究[J].物流科技,2023,46(1):85-90.
7刘春,彭太平.大规模AGV的改进时间窗路径规划[J].计算机应用研究,2023,40(1):52-56. 被引量：1
8蔡泽,胡耀光,闻敬谦,张立祥.复杂动态环境下基于深度强化学习的AGV避障方法[J].计算机集成制造系统,2023,29(1):236-245. 被引量：4
9陈恺丰,田博睿,李和清,赵晨阳,陆祖兴,李新德,邓勇.基于DDPG算法的双轮腿机器人运动控制研究[J].系统工程与电子技术,2023,45(4):1144-1151. 被引量：8
10侯成铭.煤矿井下燃油运输车辆调度多目标优化分析[J].兰州工业学院学报,2023,30(2):88-93. 被引量：2

1刘青.汽车电器解析方法讨论[J].大众汽车,2019,25(6):19-22.
2陈梓庆.高速公路上汽车动力消失，本田多个车型陷“失速门”！[J].消费者报道,2019(5):77-79.
3赵金霞.核心素养下小学语文高效课堂构建探讨[J].中华少年,2019,0(33):121-121. 被引量：3
4史稳健,申威,刘若阳.乡村振兴战略环境下我国农村双向电商物流优化研究[J].物流科技,2020,43(4):107-109. 被引量：9
5周忠玉.从文化贯通上着力——王君单元整合教学探究[J].中学语文教学参考,2020,0(8):74-75.
6刘松.试玉要烧三日满,辨材须待七年期——以“鸡兔同笼”为例浅谈模型思想的建构与培养[J].新教师,2020(2):37-39. 被引量：1
7陈荣,谢浩,张水旺.基于人工鱼群算法的多区型仓库人工拣货路径优化研究[J].南阳理工学院学报,2019,11(6):6-13. 被引量：1
8韩直,陈成,王振科.基于跟踪车辆的隧道运营危害风险研究[J].隧道建设（中英文）,2019,39(S02):1-7. 被引量：1
9刘相国.基于微信的混合式学习模式在大学英语教学中的应用研究[J].祖国,2020,0(5):152-153.
10周平,韩宇泽,储强.综合管廊电力仓动态运维的解空间分割算法[J].吉林大学学报（信息科学版）,2020,38(2):179-184. 被引量：1

计算机集成制造系统

2020年第4期

浏览历史

内容加载中请稍等...

基于强化学习的超启发算法求解有容量车辆路径问题被引量：11

参考文献5

二级参考文献29

共引文献101

同被引文献102

引证文献11

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于强化学习的超启发算法求解有容量车辆路径问题 被引量：11

参考文献5

二级参考文献29

共引文献101

同被引文献102

引证文献11

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于强化学习的超启发算法求解有容量车辆路径问题被引量：11