检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

单臂Erlang(k) Bandit报酬过程被引量：1: 1; 作者邹捷中邓倩梁友《长沙电力学院学报（自然科学版）》 2006年第4期69-71,77,共4页; 应用贝叶斯方法,对未知Band it报酬过程的抽样报酬基于Erlang(k)分布的单臂Erlang(k)Band it报酬过程提出计算描述最优选择的平衡值序列的算法.有效解决了单臂Erlang(k)Band it报酬过程的最优决策问题,将Band it报酬过程基于的分布从负... 展开更多; 关键词贝叶斯方法多臂Bandit过程单臂Bandit过程 Gittins指数平衡值 Bandit报酬过程分布; 下载PDF 职称材料

非对称超市模型的报酬过程与性能优化研究: 2; 作者李泉林丁园园杨飞飞《应用概率统计》 CSCD 北大核心 2015年第4期411-431,共21页; 超市模型具有操作简单、反应快速、实时管控等优点而成为研究大型网络资源管理的一个重要数学工具,它已经在物联网、云计算、云制造、大数据、交通运输、医疗卫生等重要实际领域中获得了极为广泛的应用.目前,非对称超市模型是这个研究... 展开更多; 关键词非对称超市模型路径选择策略马氏报酬过程报酬函数值递推算法; 下载PDF 职称材料

考虑抽样时间间隔的特殊单臂Bandit报酬过程: 3; 作者邹捷中梁友《铁道科学与工程学报》 CAS CSCD 北大核心 2006年第6期87-90,共4页; 应用动态规划向后归纳法和贝叶斯方法,研究了一类特殊单臂Bandit报酬过程的最优决策问题。在这个模型中,未知Bandit过程是抽样时间间隔服从负指数分布,抽样值服从Erlang(2)分布,允许在任意时刻跳转的Bandit报酬过程。讨论了这类Bandit... 展开更多; 关键词贝叶斯方法特殊单臂Bandit报酬过程 Gittins指灵敏 Erlang(2)布; 下载PDF 职称材料

A Geometric Process Repair Model for the Repairable System Consisting of One Component 被引量：1: 4; 作者贾积身乔保民张元林《Chinese Quarterly Journal of Mathematics》 CSCD 2001年第4期76-82,共7页; This paper considers the optimal replacement problem of a repairable system consisting of one component and a single repairman, assume that the system after repair is not 'as good as new', by using the geometr... 展开更多; 关键词 expected benefit geometric process renewal reward theorem CONVOLUTION; 下载PDF 职称材料

Incremental Multi Step R Learning: 5; 作者胡光华吴沧浦《Journal of Beijing Institute of Technology》 EI CAS 1999年第3期245-250,共6页; Aim To investigate the model free multi step average reward reinforcement learning algorithm. Methods By combining the R learning algorithms with the temporal difference learning (TD( λ ) learning) algorithm... 展开更多; 关键词 reinforcement learning average reward R learning Markov decision processes temporal difference learning; 下载PDF 职称材料

人才管理的一个决策模型: 6; 作者王永兴刘嘉《大学数学》 1996年第1期14-17,共4页; 本文应用随机过程理论，结合最优化方法．给出一个企业雇员素质管理的Ｍａｒｋｏｖ决策模型．; 关键词 Markov健有报酬的Markov过程最优策略; 下载PDF 职称材料

Sugeno测度空间上的模糊更新过程被引量：1: 7; 作者张春琴李俊华《模糊系统与数学》 CSCD 北大核心 2016年第6期79-86,共8页; 研究了随机更新过程在Sugeno测度空间上的推广这一问题。基于Sugeno测度理论,在模糊环境下讨论了关于独立时间间距的更新过程;证明了一些关于模糊更新变量的极限理论;提出并证明了模糊基本更新定理;研究了更新报酬过程并给出了相关理论... 展开更多; 关键词 Sugeno测度模糊更新过程报酬过程依Sugeno测度收敛 gλ-随机变量; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	单臂Erlang(k) Bandit报酬过程	邹捷中邓倩梁友	《长沙电力学院学报（自然科学版）》	2006	1	下载PDF 职称材料
2	非对称超市模型的报酬过程与性能优化研究	李泉林丁园园杨飞飞	《应用概率统计》 CSCD 北大核心	2015	0	下载PDF 职称材料
3	考虑抽样时间间隔的特殊单臂Bandit报酬过程	邹捷中梁友	《铁道科学与工程学报》 CAS CSCD 北大核心	2006	0	下载PDF 职称材料
4	A Geometric Process Repair Model for the Repairable System Consisting of One Component	贾积身乔保民张元林	《Chinese Quarterly Journal of Mathematics》 CSCD	2001	1	下载PDF 职称材料
5	Incremental Multi Step R Learning	胡光华吴沧浦	《Journal of Beijing Institute of Technology》 EI CAS	1999	0	下载PDF 职称材料
6	人才管理的一个决策模型	王永兴刘嘉	《大学数学》	1996	0	下载PDF 职称材料
7	Sugeno测度空间上的模糊更新过程	张春琴李俊华	《模糊系统与数学》 CSCD 北大核心	2016	1	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部