-
题名基于每阶段平均费用最优的激励学习算法
被引量:3
- 1
-
-
作者
殷苌茗
陈焕文
谢丽娟
-
机构
长沙电力学院数学与计算机系
-
出处
《计算机应用》
CSCD
北大核心
2002年第4期25-27,共3页
-
基金
国家自然科学基金 (60 0 750 1 9)
-
文摘
文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优解的存在性、分阶段最优平均费用函数与初始状态的关系以及与之相关的Bellman方程。这种方法的建立 ,可以使得动态规划 (DP)
-
关键词
Q学习
最优平均费用函数
Bellman方程
智能体
激励学习算法
人工智能
-
Keywords
reinforcement learning
Q learning
optimal average cost function
Markovian decision process
Bellman equation
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名具有不耐烦顾客和多重工作休假的排队库存系统
被引量:4
- 2
-
-
作者
单琴祺
岳德权
-
机构
燕山大学理学院
-
出处
《数学的实践与认识》
2021年第4期133-144,共12页
-
基金
国家自然科学基金项(71971189)
河北省高等学校科技计划重点项目(自然科学)(ZD2018042)。
-
文摘
研究具有不耐烦顾客和多重工作休假的M/M/1/N排队库存系统模型,分别考虑了系统中库存为零时服务员休假和系统中顾客数为零时服务员休假两种休假方式,基于(s,S)库存策略,运用矩阵迭代方法得到了系统稳态概率分布,并给出系统相关性能指标,进而建立系统平均库存费用函数.通过数值算例对比分析了两种休假方式下的系统主要参数变化对系统重要性能指标的影响,并在最优费用的层面对两个模型的优劣进行了对比分析.
-
关键词
排队库存系统
不耐烦顾客
多重工作休假
(s
S)策略
平均费用函数
-
Keywords
queueing-inventory system
impatient customers
multiple working vacations
(s,S)policy
expected cost function
-
分类号
F274
[经济管理—企业管理]
O226
[理学—运筹学与控制论]
-
-
题名服务员多重休假的易逝品排队库存系统的稳态分析
被引量:1
- 3
-
-
作者
张玉英
岳德权
-
机构
燕山大学经济管理学院
燕山大学理学院
-
出处
《系统科学与数学》
CSCD
北大核心
2020年第8期1473-1491,共19页
-
基金
河北省自然科学基金项目(A2017203078)
河北省教育厅高等学校科技计划重点项目(ZD2018042)资助课题。
-
文摘
考虑(s,S)库存策略的易逝品M/M/1排队库存系统,其中库存为空时服务员多重休假,休假时间服从指数分布.顾客的到达过程服从泊松过程,服务员的服务时间,易逝品的寿命和补货时间均服从指数分布.首先,利用拟生灭过程给出系统的稳态条件.其次,研究忽略服务时间的M/M/1休假库存系统模型,并求出了系统的稳态分布.在此基础上,进一步研究具有正服务时间的M/M/1休假排队库存系统模型,并得到了系统队长,库存水平和服务员状态的乘积形式的稳态联合分布.此外,还计算了系统的性能指标,并给出了系统单位时间的平均费用函数.最后,利用数值算例分析系统参数对一些主要性能指标的影响,并利用遗传算法计算系统最优库存策略和最优平均费用.
-
关键词
排队库存系统
多重休假
易逝品
销售损失
平均费用函数
-
Keywords
Queueing-inventory system
multiple vacation
perishable items
lost sales
expected cost function
-
分类号
O226
[理学—运筹学与控制论]
F274
[经济管理—企业管理]
-