摘要
研究由多个制造商与一个零售商组成的分销系统,他们以各自的利润最大化为目标,制造商给零售商提供奖金激励,零售商提供对应于奖金激励的服务水平,制造商需要进行为零售商提供多大奖金激励的决策。利用强化学习的启发式学习算法来优化制造商应提供的最优奖金激励。
The paper studies a distribution system consisting of some manufacturers and a single retailer in SCM and uses heuristic learning algorithm which can reinforce learning to optimize the optimal bonus incentive provided by manufacturers to the retailer.
出处
《物流技术》
2007年第9期86-89,共4页
Logistics Technology
基金
国家自然科学基金项目(70401007)