期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
合作的多智能体强化学习算法
1
作者 秦前伟 邓喜才 《运筹与模糊学》 2022年第2期312-321,共10页
在多智能体的环境中,智能体的学习行为是一个有价值的研究内容。从系统设计者的角度来看,在同时存在多个智能体的环境中,能够让智能体朝着共同利益的最大化方向调整自己的行为策略,这是值得研究的。本文将提出一种合作的梯度算法(CL-WoL... 在多智能体的环境中,智能体的学习行为是一个有价值的研究内容。从系统设计者的角度来看,在同时存在多个智能体的环境中,能够让智能体朝着共同利益的最大化方向调整自己的行为策略,这是值得研究的。本文将提出一种合作的梯度算法(CL-WoLF-IGA),目的是让智能体朝着使得共同收益最大的策略学习。同时,为了让算法适用于马尔可夫博弈,我们放宽条件,提出CL-WoLF-PHC强化学习算法。该算法在只知道平均共同收益的未知环境中,也能够让使用算法的智能体最终达成能够使共同收益最大化的策略。同时,为了验证算法在实际博弈模型中的表现,我们用经典的博弈模型进行检验CL-WoLF-IGA算法。仿真结果表明,算法具有良好的收敛性。 展开更多
关键词 多智能体强化学习 博弈论 合作学习
下载PDF
基于艾滋病数据的复合分位数回归分析
2
作者 毛文杰 戴家佳 秦前伟 《应用数学进展》 2022年第10期7248-7256,共9页
HIV通过损害人体内的CD4细胞,减弱人的抵抗力而导致感染艾滋病。未感染的人每毫升血液大约含有1100个CD4细胞,所以可以通过测量患者的CD4细胞数对病情的好坏程度进行一定的评估。本文使用复合分位数回归方法对来自多中心艾滋病队列研究... HIV通过损害人体内的CD4细胞,减弱人的抵抗力而导致感染艾滋病。未感染的人每毫升血液大约含有1100个CD4细胞,所以可以通过测量患者的CD4细胞数对病情的好坏程度进行一定的评估。本文使用复合分位数回归方法对来自多中心艾滋病队列研究的数据进行分析,在响应变量与部分协变量同时缺失的情况下,我们提出了部分线性变系数模型的加权B样条复合分位数回归估计来描述整个时期CD4百分率变化的情况,并得到加权B样条复合分位数回归估计具有Horvitz-Thompson性质。同时,我们将所提出的估计方法与自适应LASSO惩罚方法相结合,得到患者的吸烟状态以及HIV感染时的年龄对HIV感染后患者的CD4百分率的影响不显著。 展开更多
关键词 艾滋病 复合分位数 自适应LASSO 缺失值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部