基于强化学习的平行航班动态定价被引量：1

Dynamic Pricing of Parallel Flights Based on the Reinforcement Learning

下载PDF

导出

摘要由于平行航班之间的竞争越来越激烈,为提高航空公司收益,对机票销售系统中的航班和旅客分别建模。将航班的动态定价问题建模成马尔可夫博弈过程,对混合类型旅客建立Logit选择模型。利用多Agent的强化学习算法对实例进行求解,结果表明WoLF-PHC算法收敛所需迭代的次数大于Nash-Q算法,但在计算速度上WoLF-PHC算法优势明显,且具有较强的适应能力。此外,航空机票的定价策略与其他易逝品有所不同,整体呈现上升趋势。而旅客环境参数的变化,也会影响定价策略。基于WoLF-PHC算法得到的定价策略对于收益提升具有积极作用。 The competition between parallel flights is becoming increasingly fierce.In this study,to improve the airline’s revenue,the flights and the passengers were separately modeled in the ticket sale system.The problem of dynamic pricing of flights was modeled as Markov game,and the Logit choice model was used to model for the mixed-type passengers.The multi-agent reinforcement learning was adopted to solve the problem in reality.The results indicated that the number of convergence for WoLF-PHC algorithm was more than that of the Nash-Q,but the WoLF-PHC algorithm had higher convergence frequency with strong adaptability.In addition,the pricing strategy of flight ticket sale process was different from that of other perishable products,which generally reflected an upward trend.The pricing strategy would also be adjusted with the modification of environment parameters of passengers.The pricing policy obtained by WoLF-PHC algorithm has positive effects on improving revenue.

作者方园乐美龙 Fang Yuan;Le Meilong(College of Civil Aviation,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)

机构地区南京航空航天大学民航学院

出处《华东交通大学学报》 2020年第1期47-53,共7页 Journal of East China Jiaotong University

基金江苏省自然科学基金项目（20151479) 中央高校基本科研业务费专项资金资助项目（NZ2016109)

关键词平行航班混合型旅客动态定价马尔可夫博弈强化学习 paralle lflights mixed-type passengers dynamic pricing Markov game reinforcement learning

分类号 U-9 [交通运输工程]

引文网络
相关文献

参考文献7

1顾颖菁,周海花.基于多阶段动态组合拍卖的联盟舱位分配研究[J].华东交通大学学报,2018,35(6):48-54. 被引量：2
2李金林,雷俊丽,冉伦,贾慧颖.航空收益管理柔性舱位控制机制的研究现状与展望[J].北京理工大学学报,2012,32(4):331-347. 被引量：8
3高金敏,乐美龙,曲林迟.机票定价与舱位控制两阶段决策方法[J].控制与决策,2019,34(6):1293-1299. 被引量：5
4朱志愚,王宗宝,刘燕,马景禄.竞争环境下多价格等级的平行航班动态定价模型研究[J].科技和产业,2016,16(9):106-112. 被引量：3
5王金田,唐昊,程文娟,毕翔.基于强化学习的异步动态定价算法[J].系统工程学报,2011,26(5):664-670. 被引量：4
6陆慧.基于多Agent的季节性商品动态定价算法[J].计算机应用,2011,31(11):3135-3139. 被引量：2
7Qian MA,Fanlin MENG,Xiao-Jun ZENG.Optimal dynamic pricing for smart grid having mixed customers with and without smart meters[J].Journal of Modern Power Systems and Clean Energy,2018,6(6):1244-1254. 被引量：4

二级参考文献137

1陈剑,肖勇波,刘晓玲.销售不定期客票背景下双航班的联合机票控制研究[J].中国管理科学,2005,13(z1):148-152. 被引量：4
2陈剑,黄河.基于树型结构的在线逆向组合拍卖模型[J].系统工程理论方法应用,2004,13(4):310-315. 被引量：13
3李晓花,萧柏春.航空公司收入管理价格与舱位控制的统一分析[J].管理科学学报,2004,7(6):63-69. 被引量：22
4陈剑,黄河.逆向组合拍卖投标者获胜概率研究[J].系统工程理论与实践,2005,25(3):13-19. 被引量：8
5卜祥智,赵辉,武振业,黄庆.基于收益管理的海运集装箱舱位分配随机规划模型[J].系统工程理论方法应用,2005,14(4):330-334. 被引量：15
6唐昊,周雷,袁继彬.平均和折扣准则MDP基于TD(0)学习的统一NDP方法[J].控制理论与应用,2006,23(2):292-296. 被引量：5
7朱金福,周艳,姚韵.航空客运舱位订座柔性控制收益分析[J].预测,2006,25(5):70-74. 被引量：6
8李金林,王民.航空客运收入管理中的超订问题研究现状与前景[J].北京理工大学学报（社会科学版）,2007,9(2):36-39. 被引量：10
9BROOKS C, FAY R, DAS R, et al. Automated strategy searches in an electronic goods market: Learning and complex price schedules [ C]//EC'99: Proceedings of the 1 st ACM conference on Electronic Commerce. New York: ACM, 1999:31-40.
10GRAHOVAC J, CHAKRAVARTY A. Sharing and lateral transship- ment of inventory in a supply chain with expensive low-demand items [ J]. Management Science, 2001, 47(4) : 579 - 594.

共引文献20

1Saeid POUYAFAR,Mehrdad TARAFDAR HAGH,Kazem ZARE.Circuit-theory-based method for transmission fixed cost allocation based on game-theory rationalized sharing of mutual-terms[J].Journal of Modern Power Systems and Clean Energy,2019,7(6):1507-1522. 被引量：2
2赵滟,李金林,袁建华.基于灵活性的工程系统投资决策框架研究[J].科学决策,2013(5):59-72.
3周蔷,刘长有.多航段舱位控制与定价策略[J].河南科技大学学报（自然科学版）,2014,35(3):32-37. 被引量：2
4张哲语,李怡含.关于国内OTA企业引进酒店预订反向定价模式可行性的研究分析——基于非平稳半马氏决策过程[J].特区经济,2018(12):99-104. 被引量：3
5王璇,冯志猛.基于旅客舱位选择的航空收益管理[J].新经济,2015(11):1-1.
6陈玉宝,戴雅兰.“互联网+航空运输业”C2B定价策略研究[J].价格理论与实践,2016(11):126-129. 被引量：2
7许雪琦,陈思,李真真.竞争环境下基于顾客离散选择的酒店房间动态定价研究[J].生产力研究,2017(5):100-102.
8雷俊丽,蒋国银.易逝品不透明销售模式顾客接受意愿实证分析[J].技术经济与管理研究,2018(12):68-74. 被引量：1
9王欣,王芳.基于强化学习的动态定价策略研究综述[J].计算机应用与软件,2019,36(12):1-6. 被引量：6
10邵佳佳,杨文东,江海.基于复杂网络的航空联盟航线网络鲁棒性分析[J].华东交通大学学报,2020,37(1):39-46. 被引量：3

同被引文献8

1文书生,叶怀珍.基于VAR模型的中国铁路货运需求实证分析[J].重庆大学学报（自然科学版）,2007,30(10):152-158. 被引量：6
2姜爱萍,夏浩,高峻峻,池秋果,吴思予.电力物资复合泊松需求下的最优订货量[J].工业工程,2016,19(3):90-95. 被引量：1
3张小强,刘丹,陈兵,张锦.竞争环境下铁路集装箱班列动态定价与开行决策研究[J].铁道学报,2017,39(2):17-23. 被引量：18
4高醒,李夏苗,彭鹏.铁路货运量预测过程中的关键技术分析[J].科技和产业,2018,18(5):1-8. 被引量：6
5王鑫,吴际,刘超,杨海燕,杜艳丽,牛文生.基于LSTM循环神经网络的故障时间序列预测[J].北京航空航天大学学报,2018,44(4):772-784. 被引量：346
6宋文波,赵鹏,李博.高速铁路单列车动态定价与票额分配综合优化研究[J].铁道学报,2018,40(7):10-16. 被引量：29
7张立欣,张艳波,杨翠芳.基于X11-ARIMA模型的铁路货运周转量分析[J].数学的实践与认识,2018,48(17):154-161. 被引量：6
8刘清芳.铁路集装箱运输发展对策探讨[J].铁道运输与经济,2020,42(9):34-39. 被引量：19

引证文献1

1唐慧敏,谭雪,张小强,梁越.不确定需求下铁路集装箱动态定价研究[J].交通运输工程与信息学报,2021,19(3):133-142. 被引量：4

二级引证文献4

1片峰,陈阳,庞世花,苏敏.考虑铁路折扣的集装箱公路与多式联运博弈定价[J].交通运输系统工程与信息,2022,22(4):1-10. 被引量：5
2杨文东,彭纪元,姜雨.面向空铁联运旅客选择行为的两阶段容量控制方法[J].交通信息与安全,2023,41(6):124-131.
3程晓莉,张小强,陈鹏芳.面向批量订购的铁路集装箱班列动态舱位控制[J].交通运输工程与信息学报,2024,22(2):63-76.
4徐如君,张小强.考虑时间价值的中欧班列多级定价与舱位控制[J].交通运输工程与信息学报,2024,22(2):77-89.

1胡晴,吕世超,石志强,孙利民,肖亮.基于专家系统的高级持续性威胁云端检测博弈[J].计算机研究与发展,2017,54(10):2344-2355. 被引量：8
2杨峻楠,张红旗,张传富.基于随机博弈与改进WoLF-PHC的网络防御决策方法[J].计算机研究与发展,2019,56(5):942-954. 被引量：11
3汤泽容.浅谈汽车产品的三个定价策略[J].当代旅游（下旬刊）,2019(10):00138-00138.
4陈秀娟.日本电产押注电动车[J].汽车观察,2020,0(2):112-112.
5苏娟,张阔亮,余跃生,张宝石,许向阳,张新炼,张镇旭.高职护生C型人格特征和气质类型关系研究[J].中国卫生产业,2019,16(29):183-185. 被引量：1
6贺康康,任刚.动态停车预约收费条件下的出行行为选择研究[J].交通运输工程与信息学报,2020,18(1):53-60. 被引量：14
7谭章禄,袁慧,任双恒.上市公司“五性”间的波动溢出效应研究——基于面板及BEKK-GARCH模型的分析[J].金融,2019,9(6):573-585.
8韩俊樱,张振宇,孔德仕.移动群智感知中面向用户区域的分布式多任务分配方法[J].计算机应用,2020,40(2):358-362. 被引量：9
9于卓智,张叶峰,韩冰洋,陈文伟,王栋.基于量子通信的电力业务调度算法[J].电信科学,2019,35(11):108-116. 被引量：4
10刘中明,周岩,刘博,安林林,赵云强.基于改进深度强化学习的电力智慧供应链高维度决策模型研究[J].电子测量技术,2019,42(23):53-60. 被引量：15

华东交通大学学报

2020年第1期

浏览历史

内容加载中请稍等...

基于强化学习的平行航班动态定价被引量：1

参考文献7

二级参考文献137

共引文献20

同被引文献8

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于强化学习的平行航班动态定价 被引量：1

参考文献7

二级参考文献137

共引文献20

同被引文献8

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于强化学习的平行航班动态定价被引量：1