基于强化学习的装箱问题研究被引量：1

Research on Packing Problem Based on Reinforcement Learning

下载PDF

导出

摘要论文提出了一种基于改进规则和强化学习的混合启发式算法来求解二维带装箱问题(2D Strip Packing Problem,2DSPP)。首先,对基于skyline算法的评分规则进行了改进。其次使用Deep Q-Network(DQN)来获得初始的矩形物品序列,它可以提高空间利用率,防止算法陷入局部最优。将改进的评分规则与DQN相结合,提出了基于简单随机算法(SRA)的启发式算法,称为基于强化学习的简单随机算法(RSRA)。用五种算法对8个数据集进行了实验比较。结果表明,RSRA在8个数据集(C,N,CX,NT,2sp,NP,ZDF,BWMV)上的性能最好,Ave.Gap%分别比GRASP、SRA、IA、ISH算法分别提高45.86%、45.16%、30.89%和20.56%。 This paper proposes a hybrid heuristic algorithm based on improved rules and reinforcement learning to solve 2D strip packing problem(2DSPP).Firstly,the scoring rules based on skyline algorithm are improved.Secondly,deep q-network(DQN)is used to obtain the initial rectangular item sequence,which can improve the space utilization and prevent the algorithm from falling into local optimum.Combining the improved scoring rules with DQN,a heuristic algorithm based on simple random algorithm(SRA)is proposed,which is called simple random algorithm based on reinforcement learning(RSRA).Five algorithms are used to compare 8 datasets.The results show that RSRA has the best performance on 8 datasets(C,N,CX,NT,2SP,NP,ZDF,BWMV).Compared with grasp,SRA,IA and ISH algorithms,Ave.Gap%are improved by 45.86%,45.16%,30.89%and 20.56%respectively.

作者纪乃华李祥栋祝凯 JI Naihua;LI Xiangdong;ZHU Kai(School of Information and Control Engineering,Qingdao University of Technology,Qingdao 266520)

机构地区青岛理工大学信息与控制工程学院

出处《计算机与数字工程》 2022年第12期2633-2638,共6页 Computer & Digital Engineering

关键词二维带装箱问题 DQN 强化学习启发式算法改进的规则 2D Strip packing problem DQN reinforcement learning heuristic algorithm improved rules

分类号 TP242.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

同被引文献7

1马玲,左燕,彭冬亮,任金磊.基于POMDP的多机无源传感器协同任务规划[J].无线电工程,2022,52(7):1260-1265. 被引量：1
2郁洲,毕敬,苑海涛.基于改进DQN算法的复杂海战场路径规划方法[J].智能科学与技术学报,2022,4(3):418-425. 被引量：3
3何丽.SDN与云计算在系统仿真平台中的应用[J].铁路通信信号工程技术,2022,19(12):38-41. 被引量：4
4李胜,韩龙哲,敖晨晨,汪泽恒,张波,张翼英.面向车联网的DQN多级边缘缓存算法[J].南昌工程学院学报,2022,41(6):78-85. 被引量：2
5齐分岭,韦国军,侯炜,何能波.卫星装备在役考核数据采集研究[J].舰船电子工程,2022,42(11):106-112. 被引量：1
6陈浩然,朱巍,于胜.基于深度强化学习的应急通信网规划方法[J].指挥控制与仿真,2023,45(1):150-156. 被引量：1
7过萌竹,孙君.基于强化学习的D3QN拥塞控制算法[J].计算机技术与发展,2023,33(2):105-109. 被引量：1

引证文献1

1齐分岭,刘智磊,张永军,许延峰,石成豪.基于强化学习的自适应网络威胁缓解[J].通信与信息技术,2024(3):6-10.

1汤斌.甲方视角浅谈产研办公类混凝土结构装配式建筑工程管理若干问题[J].中文科技期刊数据库（全文版）工程技术,2021(6):26-27.
2胡丹丹,蔡曙轩.基于用户满意度与排队论的电动汽车充电站选址定容优化[J].现代商贸工业,2023,44(3):77-80. 被引量：1
3李晓飞.基于Skyline的建筑设计数据挖掘方法[J].长春工业大学学报,2022,43(3):284-288.
4王雅杰,樊建春.南海海域应急资源存储选址及调度方案研究[J].安全与环境学报,2023,23(1):178-185. 被引量：2
5王群,李晨宇,周忠华,曹文,周子吉,孙慧慧,黄悦,沈志奇.化学钢化前后玻璃表面裂纹扩展的实验比较与数值模拟[J].材料导报,2023,37(5):81-85.
6李珍萍,施莹,吴凌云.多约束混流线平衡与排序优化问题研究[J].系统仿真学报,2023,35(1):27-40. 被引量：3
7孙国璋,黄山,艾力卡木·再比布拉,徐浩桐,段晓东.基于Flink的k-支配skyline体并行求解算法[J].计算机工程与科学,2023,45(1):17-27. 被引量：1
8吴汪友,刘伟,姚钟华.一种层次混合量化苹果品质分级的研究[J].中国南方果树,2023,52(1):152-156. 被引量：2
9朱元正,吕启闻,官瑜,刘且根.基于深度能量模型的低剂量CT重建[J].CT理论与应用研究（中英文）,2022,31(6):709-720. 被引量：1
10黎颖,吴清锋,刘佳桐,邹嘉龙.引导性权重驱动的图表问答重定位关系网络[J].中国图象图形学报,2023,28(2):510-521. 被引量：1

计算机与数字工程

2022年第12期

浏览历史

内容加载中请稍等...

基于强化学习的装箱问题研究被引量：1

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的装箱问题研究 被引量：1

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的装箱问题研究被引量：1