期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的高铁客票动态定价算法
1
作者 毕文杰 陈功 《计算机应用与软件》 北大核心 2024年第4期228-235,261,共9页
为了解决需求函数未知情况下的高铁客票动态定价问题。以最大化单列车期望收益为目标构建Markov多阶段决策模型并设计DQN(Deep Q Net)强化学习框架寻找动态定价最优策略。算法以当日收益为奖励,通过神经网络来逼近所有状态-动作组合的... 为了解决需求函数未知情况下的高铁客票动态定价问题。以最大化单列车期望收益为目标构建Markov多阶段决策模型并设计DQN(Deep Q Net)强化学习框架寻找动态定价最优策略。算法以当日收益为奖励,通过神经网络来逼近所有状态-动作组合的期望最优收益。为验证算法性能,基于市场动态和旅客行为,开发高铁客运需求模拟系统并进行仿真实验。实验结果表明,智能体动态定价策略可以在不同需求水平下灵活调整价格,其性能接近理论上界并且显著优于对比策略。 展开更多
关键词 收益管理 高铁客票定价 动态定价 动态规划 强化学习 环境模拟算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部