基于马氏决策过程的易逝品联合策略被引量：3

Jointed decisions for perishable product with Markov decision process

下载PDF

导出

摘要为了有效解决零售商在销售易逝品时的订货、旧产品处理及定价的联合决策问题,提出运用马氏决策过程建立模型及使用Q学习算法求得最优策略。最优策略包括各个状态下选择的决策动作,它能使从现在起及后续无限期的贴现总值为最大。算法中的迭代公式通过不断与环境进行互动并得到反馈,时刻更新最优策略。基于有限的状态集和动作集,在状态转移概率及当期期望收益未知的情况下,算法经过长时间学习后能够得到稳定的最优策略。研究发现,各参数(变化)对联合策略中各策略的特征有不同的影响,该结论为启发式策略的相关研究提供了一定的理论支持和解决思路。 To solve the jointed decisions problem of ordering,pricing and old products disposing faced for selling perishable products with a multi-period shelf life over an infinite horizon effectively,a model with Markov decision theory was established and the optimal policy was computed by using Q-learning algorithm.The optimal policy indicated the action of all states which could maximize the long-run discounted expected profit from current period.Through interacting with the environment and obtaining the feedback continuously,the iterate formula of algorithm renewed the optimal policy constantly.The stationary optimal policy would be computed after sufficient learning under situation of state and action space were finite and discrete,while the state transition probability and expected profit were not necessarily be known.The research showed that the different parameters had different and significant impact on the characteristic of each decision,and the conclusion provided some support and thought for researches of heuristic strategy.

作者郑江波程福阳杨柳

机构地区暨南大学管理学院

出处《计算机集成制造系统》 EI CSCD 北大核心 2017年第1期144-153,共10页 Computer Integrated Manufacturing Systems

基金广东省自然科学基金资助项目(2016Z00052)~~

关键词易逝品马氏决策过程 Q学习算法订货策略定价策略 perishable product Markov decision process Q-learning algorithm ordering decisions pricing decisions

分类号 F272 [经济管理—企业管理] F275 [经济管理—企业管理]

引文网络
相关文献

参考文献2

1官振中,任建标.价格和库存驱动替代的两产品动态定价策略[J].系统管理学报,2013,22(2):177-184. 被引量：11
2陈旭.考虑需求信息更新的易逝品的订货策略[J].计算机集成制造系统-CIMS,2003,9(11):1038-1043. 被引量：17

二级参考文献16

1陈剑,肖勇波,刘晓玲,陈友华.基于乘客选择行为的航空机票控制模型研究[J].系统工程理论与实践,2006,26(1):65-75. 被引量：16
2EECKHOUDT L, GOLLIER C. SCHLESINGER H. The risk averse (and prudent) newsboy[J]. Management Science, 1995, 41:786-794.
3LAU A, LAU H. The newsboy problem with price-dependent demand distribution[J]. IIE Transactions, 1988, 20:168-175.
4FISHER M, RAMAN A. Reducing the cost of demand uncertainty through accurate response to early sales[J]. Operations Research, 1996, 44(1): 87-99.
5LYER A, BERGEN M. Quick response in manufacturer retailer channels[J]. Management Science, 1997, 43: 559-570.
6Eppen G D, Iyer A V. Improved fashion buying with Bayesian updates[J]. Operations Research, 1997,45:805-819.
7SMITH S A, AGREWAL N, MCLNTYRE S H. A discrete optimization model for seasonal merchandise planning[J]. Journal of Retailing, 1998,74:193-221.
8CHUNG K. Risk in inventory models:the case of the newsboy problem, optimality conditions[J]. Journal of Operational Research Society, 1990, 41:173-176.
9LAU A, LAU H. The newsstand problem:a capacitated multi-product single period inventory problem[J]. Operations Research, 1996, 94:29-42.
10CHANG P L, LIN C T. On the effect of centralization of the expected costs in a multi-location newsboy problem[J]. Journal of Operational Research Society, 1991, 42:1025-1030.

共引文献26

1张醒洲,张蕾.需求不确定的供应链两阶段订货模型[J].运筹与管理,2005,14(6):45-50. 被引量：9
2曾祥兴,王喜成.需求信息更新下短生命周期产品的订货模型[J].桂林电子工业学院学报,2006,26(3):226-229. 被引量：6
3曾祥兴,王喜成.市场需求变化条件下短生命周期产品的订货策略[J].物流科技,2006,29(9):134-138. 被引量：2
4刘北林,马文惠.二次订货策略在易逝品供应链协调中的应用研究[J].物流科技,2009,32(1):121-124. 被引量：1
5赵晋,张艳霞.快速响应策略下二次订货效益的仿真分析[J].上海管理科学,2009,31(2):35-37.
6薛恒新,张庆民,陈成.基于多层分解法和遗传算法的动态智能补货模型[J].计算机集成制造系统,2009,15(6):1088-1097.
7马福珍,余东,吴浩.带有可追加订购和季节性销售的报童问题[J].湖北师范学院学报（自然科学版）,2009,29(3):89-94. 被引量：2
8徐辉,李成严,周力波.基于蚁群算法的易逝品订货问题研究[J].哈尔滨理工大学学报,2010,15(3):10-13.
9陈阳,叶怀珍.需求不确定下的供应链精柔协同研究综述[J].铁道运输与经济,2010,32(12):73-77. 被引量：1
10方卫国,李立.不同供应链合同的最优订货策略及适用性比较[J].工业工程,2011,14(3):60-65.

同被引文献18

1蒋国飞,吴沧浦.Q学习算法在库存控制中的应用[J].自动化学报,1999,25(2):236-241. 被引量：20
2戴伟.一种改进企业在框架协议下库存管理的方法[J].运筹与管理,2011,20(4):182-186. 被引量：1
3李启庚,余明阳.品牌体验价值对品牌资产影响的过程机理[J].系统管理学报,2011,20(6):744-751. 被引量：27
4毕功兵,王怡璇,丁晶晶.存在替代品情况下考虑消费者策略行为的动态定价[J].系统工程学报,2013,28(1):47-54. 被引量：36
5官振中,任建标.存在策略消费者的动态定价策略[J].系统工程理论与实践,2014,34(8):2018-2024. 被引量：40
6巩天啸,王玮,陈丽华,蓝颖杰.面对策略型消费者的产品创新换代策略[J].管理科学学报,2015,18(9):1-11. 被引量：24
7毛照昉,王方圆.基于消费者行为和估值折扣差异的易逝品两期定价决策研究[J].管理学报,2017,14(3):441-450. 被引量：27
8杨华龙,叶迪,张倩,曾庆成.时间窗变动的车辆调度干扰管理模型与算法[J].运筹与管理,2017,26(10):56-64. 被引量：15
9赵菊,邱菊,胡小建,刘媛媛.基于策略消费者的差异化产品推出及定价研究[J].系统工程理论与实践,2017,37(12):3098-3108. 被引量：29
10张金隆,吴翔,徐浩轩.易变质新产品定价与补货联合决策模型[J].系统工程学报,2018,33(1):79-89. 被引量：6

引证文献3

1胡晓华.基于体验式营销的易逝品定价和订货联合策略研究[J].投资与创业,2022,33(3):49-52.
2郑江波,甘燕红.共生换代背景下面向策略型消费者的联合策略[J].系统工程,2020,38(2):69-78. 被引量：6
3祁玉青,赵兴雷,赵田东杰.考虑框架协议的动态报童模型强化学习建模研究[J].运筹与管理,2022,31(10):105-112.

二级引证文献6

1王可可,潘红玉,贺正楚,吴艳.策略型消费者对易逝品制造商动态库存与定价的影响研究[J].湖南师范大学自然科学学报,2021,44(3):89-94. 被引量：1
2孙晓兰,郑跃.考虑消费者预期后悔的供应链定价策略研究[J].井冈山大学学报（自然科学版）,2021,42(4):12-17.
3张喜征,肖嘉琳,余思勤.预期后悔行为下考虑以旧换新产品的换代与定价策略[J].系统工程,2022,40(6):55-66. 被引量：1
4吕志芳.考虑共生换代背景下的最优定价研究[J].中国经贸,2021(15):91-93.
5谭德庆,冷家正.耐用品垄断企业新款产品上市策略研究[J].软科学,2023,37(4):78-85.
6谭德庆,冷家正.考虑消费者情绪效用下新款产品上市策略[J].系统管理学报,2024,33(5):1386-1396.

1杨柳青.企业竞争的十大策略[J].民营导报,2000(5):47-47.
2王寿斌.企业市场竞争十大策略[J].中外企业家,2000(10):73-74.
3王徽,陈王廷.经济系统中马氏决策过程的状态跳跃研究[J].清华大学学报（自然科学版）,1996,36(11):99-104.
4李航,刘昌杰,孙静亚.跨国品牌联合的风险分析与防范[J].对外经贸实务,2010(9):93-95. 被引量：1
5李随成,尹洪英.基于Q学习的供应链分销系统最优订货策略研究[J].控制与决策,2005,20(12):1404-1407. 被引量：2
6杨柳青.企业市场竞争的十大策略[J].财会月刊（合订本）,2000(19):7-7.
7孙寿亮.区域经济环境下的供应链同步化联合策略应用[J].管理现代化,2006,26(6):60-62. 被引量：1
8杨柳青.企业市场竞争的10大策略[J].企业技术开发,2000,18(9):26-26.
9良言.企业如何借牌成名[J].乡镇企业科技,2004(3):15-16.
10李一,霍开杰.马尔可夫模型对企业人力资源的流动分析[J].现代管理科学,2008(1):108-110. 被引量：5

计算机集成制造系统

2017年第1期

浏览历史

内容加载中请稍等...

基于马氏决策过程的易逝品联合策略被引量：3

参考文献2

二级参考文献16

共引文献26

同被引文献18

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于马氏决策过程的易逝品联合策略 被引量：3

参考文献2

二级参考文献16

共引文献26

同被引文献18

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于马氏决策过程的易逝品联合策略被引量：3