最后一公里路径优化是提高物流企业配送效率的关键问题。本研究将深度强化学习中求解组合优化的方法(Learning to Optimize,L2O)与遗传算法相结合,提出一种混合算法,以求解最后一公里路径优化问题。在L2O模块中,扩展了已有框架,引入时...最后一公里路径优化是提高物流企业配送效率的关键问题。本研究将深度强化学习中求解组合优化的方法(Learning to Optimize,L2O)与遗传算法相结合,提出一种混合算法,以求解最后一公里路径优化问题。在L2O模块中,扩展了已有框架,引入时间和剩余容量编码器,有效反映了问题的时间和容量约束。同时,遗传算法模块采用重启策略和采样概率调控,更充分地利用了L2O的网络信息。基于亚马逊实际业务数据构建测试集,计算结果表明,在同样的求解时间内,该算法优于Gurobi求解器和扩展的指针网络算法。展开更多
文摘最后一公里路径优化是提高物流企业配送效率的关键问题。本研究将深度强化学习中求解组合优化的方法(Learning to Optimize,L2O)与遗传算法相结合,提出一种混合算法,以求解最后一公里路径优化问题。在L2O模块中,扩展了已有框架,引入时间和剩余容量编码器,有效反映了问题的时间和容量约束。同时,遗传算法模块采用重启策略和采样概率调控,更充分地利用了L2O的网络信息。基于亚马逊实际业务数据构建测试集,计算结果表明,在同样的求解时间内,该算法优于Gurobi求解器和扩展的指针网络算法。