供应链分销系统奖金优化与仿真分析

Bonus Optimization & Simulation Analysis of Distribution System in SCM

下载PDF

导出

摘要研究由多个制造商与一个零售商组成的分销系统,他们以各自的利润最大化为目标,制造商给零售商提供奖金激励,零售商提供对应于奖金激励的服务水平,制造商需要进行为零售商提供多大奖金激励的决策。利用强化学习的启发式学习算法来优化制造商应提供的最优奖金激励。 The paper studies a distribution system consisting of some manufacturers and a single retailer in SCM and uses heuristic learning algorithm which can reinforce learning to optimize the optimal bonus incentive provided by manufacturers to the retailer.

作者权小锋尹洪英

机构地区鲁东大学管理学院上海交通大学安泰经济与管理学院

出处《物流技术》 2007年第9期86-89,共4页 Logistics Technology

基金国家自然科学基金项目(70401007)

关键词供应链管理分销系统强化学习 SCM distribution system reinforced learning

分类号 F224.0 [经济管理—国民经济] F273.7 [经济管理—企业管理]

引文网络
相关文献

参考文献12

1王迎军,高峻峻,郭亚军.基于需求预测的分销系统成本模型[J].系统工程学报,2006,21(1):97-101. 被引量：1
2李随成,尹洪英.基于Q学习的供应链分销系统最优订货策略研究[J].控制与决策,2005,20(12):1404-1407. 被引量：2
3王瑛,孙林岩,李天飞.基于遗传算法的集成产销系统参数优化[J].中国管理科学,2004,12(1):51-56. 被引量：6
4王迎军,高峻峻.供应链分销系统优化及仿真[J].管理科学学报,2002,5(5):79-84. 被引量：36
5田厚平,郭亚军,杨耀东.分销系统中多委托人及委托人可能合作的委托代理问题[J].系统工程理论方法应用,2004,13(4):361-366. 被引量：23
6王醒策,张汝波,顾国昌.多机器人动态编队的强化学习算法研究[J].计算机研究与发展,2003,40(10):1444-1450. 被引量：15
7Antonio Murciano,Jose del R.Millan,Javier Zamora.Specialization in multi-agent systems through learning[J].Biological Cybernetics,1997:76,375-382.
8李春贵,刘永信.一种有限时段Markov决策过程的强化学习算法[J].广西工学院学报,2003,14(1):1-4. 被引量：4
9C.O.Kim,J.Jun,J.K.Baek,R.L.Smith,Y.D.Kim.Adaptive inventory control models for supply chain management[J].Int J Adv Manuf Technol,2004,Original Article:267-276.
10张春阳,陈小平,刘贵全,蔡庆生.Q-learning算法及其在囚徒困境问题中的实现[J].计算机工程与应用,2001,37(13):121-122. 被引量：7

二级参考文献73

1PR科恩周少柏等（译）.人工智能手册（第三卷）[M].科学出版社,1991..
2Sutton R S,Barto A G. Reimforcement learning: an introduction[M] .MA:MIT Press, 1998.
3Brown X T. Low power wireless communication via reinforcement learning[A]. In: Advances in Neural Information Processing Systems[C] .MIT press,2000(12):893 ～ 899.
4Mataric M J. Cetting humanoids to move and imitate[J].IEEE Intelligent Systems,2000(7): 18 ～ 24.
5Mill' an R, Posenato D, Dedieu E. Continuous - Action Qlearning[ J]. Machine Learning,2002(49):247 ～ 265.
6Shapiro D. Value - driven agents[ D]. Ph. D. thesis, Stanford University, 2001.
7Rennie J, McCallum A. Using reinforcement leaming to spider the web efficiently[A]. In: Pwroc of International Conference on Machine Learning (ICML)[C] .1999.
8Sutton R S. Open theoretical questions in reinforcement leaming[A]. In:Proc of EuroCOLT'99[ C] .1999,11 ～ 17.
9Barto A G, Mahadevan S. Recent advances in hierarchical reinforcement learning [ J ]. Special Issue on Reinforcement Learning, Discrete Event Systems,2003,23(4): 197 ～ 223.
10Hailu G,Sommer G.On amount and quality of bias in reinforcement learning[ A]. In: Proc of IEEE SMC' 99[ C].1999, 1491 ～ 1495.

共引文献95

1范体军,李宏余,陈荣秋.磷化工企业生产分销计划的数学模型及其应用[J].系统管理学报,2006,15(6):481-489.
2谢海真,计国君.企业间单委托多代理问题及激励模型研究[J].东南大学学报（哲学社会科学版）,2006,8(S2):69-71. 被引量：2
3秦颖,李涛,张智勇,邹敢.一种面向工程应用的多移动搬运机器人系统结构[J].中南大学学报（自然科学版）,2013,44(S2):21-27. 被引量：4
4高峻峻,王迎军,郭亚军.地区分销系统的成本优化模型及应用[J].系统工程学报,2004,19(5):457-464. 被引量：5
5王逢春,鄢萍,刘飞,刘颖.分销管理系统可扩展性分析及研究[J].中国机械工程,2004,15(23):2116-2121. 被引量：2
6王迎军.顾客需求驱动的供应链契约问题综述[J].管理科学学报,2005,8(2):68-76. 被引量：60
7高峻峻,王迎军,郭亚军.多产品分销系统的利润模型[J].系统工程理论方法应用,2005,14(2):124-130. 被引量：7
8陈顺正,宋国防,杨国东.基于混合需求多产品的供应链库存优化模型[J].上海大学学报（自然科学版）,2005,11(3):314-319. 被引量：10
9杜少甫,梁樑,余雁.弹性约束CSP及其基于遗传算法的交互式求解Agent[J].中国管理科学,2005,13(3):56-61. 被引量：2
10高峻峻,吕芹,王迎军,胡乐江.替代性需求下的分销系统库存决策[J].系统工程理论方法应用,2005,14(5):437-442. 被引量：3

1强化学习提高认识确保“三讲”教育工作扎实有效[J].山东审计,1999(5):4-6.
2陈皓.强化学习坚定信心努力提升工会财务工作水平[J].中国工会财会,2015,0(1):10-10. 被引量：1
3陈媛.论会计信息化条件下的会计人员素质[J].中国乡镇企业会计,2015(5):237-239. 被引量：3
4谢广和.农垦企业创新企业思想政治工作的途径[J].现代农业科技,2010(18):359-360. 被引量：1
5中宁县队三要求加强一体化住户调查工作[J].统计与经济,2013(2):58-58.
6肖桂春,李玲俐.仓储管理中优化与仿真应用的探讨[J].中国市场,2007(49):100-102. 被引量：1
7抓住机遇学规范采取措施促建设[J].河北审计,1997(5):9-9.
8黄明凤.企业领导干部强化学习的几点思考[J].中国军转民,2009(3):52-53.
9李双萍,胡晓华.构筑人才高地提高整体素质[J].浙江国土资源,2006(5):36-37.
10冯友.创新农垦企业职工思想政治工作的关键所在[J].卷宗,2014,4(10):378-378.

物流技术

2007年第9期

浏览历史

内容加载中请稍等...

供应链分销系统奖金优化与仿真分析

参考文献12

二级参考文献73

共引文献95

相关作者

相关机构

相关主题

浏览历史