-
题名波动需求库存路径问题的持续自学习求解算法
被引量:1
- 1
-
-
作者
郭羽含
李津宁
沈学利
-
机构
浙江科技学院理学院
辽宁工程技术大学软件学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2024年第4期1487-1505,共19页
-
基金
国家自然科学基金资助项目(61404069)
辽宁省自然科学基金资助项目(2019-ZD-0048)
辽宁省教育厅基础研究项目(LJ2019JL012)。
-
文摘
共享单车库存路径问题是一种受商品总量约束且需求周期性波动的库存路径问题,其优化过程需综合考虑资源利用率和调度成本,在求解大规模算例时难以同时保证求解效率和质量。针对上述挑战,将问题形式化为多目标序列化决策的马尔可夫过程,建立了时间序列混合整数规划模型并提出了一种全局持续自学习算法。算法由离线学习、在线规划和持续学习三阶段构成。离线学习阶段设计了基于随机策略的多智能体协同算法以获取配送载具时空分布和需求点需求模式的定量化描述;在线规划阶段根据历史订单数据,对各时间步中的需求模式进行预测以确定最优的库存分配数量,并利用离线学习阶段的定量信息对供应商配送载具进行调度;持续学习阶段于每个处理周期结束后使用记录的订单数据对周期内调度结果进行持续评估和改进。基于企业真实数据的实验表明,在需求预测模型复杂程度、求解质量、调度载具总数量、总调度距离和站点改善程度等的综合评价指标上,所提算法优于对比方法。此外,通过对多种策略进行对比分析,总结出了库存问题的成本变化规律,并验证了算法在大规模算例下的有效性。
-
关键词
库存路径
产品需求周期波动
强化学习
在线规划
持续学习
-
Keywords
inventory routing
periodic and cyclic fluctuation of demand
reinforcement learning
online planning
persistent learning
-
分类号
TP11
[自动化与计算机技术—控制理论与控制工程]
-