期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于每阶段平均费用最优的激励学习算法 被引量:3
1
作者 殷苌茗 陈焕文 谢丽娟 《计算机应用》 CSCD 北大核心 2002年第4期25-27,共3页
文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优... 文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优解的存在性、分阶段最优平均费用函数与初始状态的关系以及与之相关的Bellman方程。这种方法的建立 ,可以使得动态规划 (DP) 展开更多
关键词 Q学习 最优平均费用函数 Bellman方程 智能体 激励学习算法 人工智能
下载PDF
具有不耐烦顾客和多重工作休假的排队库存系统 被引量:4
2
作者 单琴祺 岳德权 《数学的实践与认识》 2021年第4期133-144,共12页
研究具有不耐烦顾客和多重工作休假的M/M/1/N排队库存系统模型,分别考虑了系统中库存为零时服务员休假和系统中顾客数为零时服务员休假两种休假方式,基于(s,S)库存策略,运用矩阵迭代方法得到了系统稳态概率分布,并给出系统相关性能指标... 研究具有不耐烦顾客和多重工作休假的M/M/1/N排队库存系统模型,分别考虑了系统中库存为零时服务员休假和系统中顾客数为零时服务员休假两种休假方式,基于(s,S)库存策略,运用矩阵迭代方法得到了系统稳态概率分布,并给出系统相关性能指标,进而建立系统平均库存费用函数.通过数值算例对比分析了两种休假方式下的系统主要参数变化对系统重要性能指标的影响,并在最优费用的层面对两个模型的优劣进行了对比分析. 展开更多
关键词 排队库存系统 不耐烦顾客 多重工作休假 (s S)策略 平均费用函数
原文传递
服务员多重休假的易逝品排队库存系统的稳态分析 被引量:1
3
作者 张玉英 岳德权 《系统科学与数学》 CSCD 北大核心 2020年第8期1473-1491,共19页
考虑(s,S)库存策略的易逝品M/M/1排队库存系统,其中库存为空时服务员多重休假,休假时间服从指数分布.顾客的到达过程服从泊松过程,服务员的服务时间,易逝品的寿命和补货时间均服从指数分布.首先,利用拟生灭过程给出系统的稳态条件.其次... 考虑(s,S)库存策略的易逝品M/M/1排队库存系统,其中库存为空时服务员多重休假,休假时间服从指数分布.顾客的到达过程服从泊松过程,服务员的服务时间,易逝品的寿命和补货时间均服从指数分布.首先,利用拟生灭过程给出系统的稳态条件.其次,研究忽略服务时间的M/M/1休假库存系统模型,并求出了系统的稳态分布.在此基础上,进一步研究具有正服务时间的M/M/1休假排队库存系统模型,并得到了系统队长,库存水平和服务员状态的乘积形式的稳态联合分布.此外,还计算了系统的性能指标,并给出了系统单位时间的平均费用函数.最后,利用数值算例分析系统参数对一些主要性能指标的影响,并利用遗传算法计算系统最优库存策略和最优平均费用. 展开更多
关键词 排队库存系统 多重休假 易逝品 销售损失 平均费用函数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部