期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于延迟策略的最大熵优势演员评论家算法 被引量:1
1
作者 祁文凯 桑国明 《小型微型计算机系统》 CSCD 北大核心 2020年第8期1656-1664,共9页
在强化学习中智能体通过与环境交互获得奖励值,更高的奖励值需要更优的策略,但在高维复杂的环境中,传统的强化学习算法交互产生的样本复杂度较高,并且会产生过估计问题,导致计算最优策略的过程产生较大的波动,算法难以收敛.针对上述问题... 在强化学习中智能体通过与环境交互获得奖励值,更高的奖励值需要更优的策略,但在高维复杂的环境中,传统的强化学习算法交互产生的样本复杂度较高,并且会产生过估计问题,导致计算最优策略的过程产生较大的波动,算法难以收敛.针对上述问题,提出了一种基于延迟策略的最大熵优势演员评论家强化学习算法(DAAC).DAAC算法基于传统的策略梯度演员评论家算法框架,使用了两个评论家网络,分别计算状态值函数和动作的优势估计值函数并最大化目标策略的预期熵,在评论家网络中使用延迟策略更新的技巧.该算法在基于Linux平台的OpenAI Gym的物理仿真模拟器Mu JoCo进行了实验,并与传统的强化学习算法DQN,TRPO,DDPG在不同的机器人模拟器中作对比,实验结果表明,DAAC算法有效地降低了计算过程的波动性,使策略更快收敛到最优解并获得了更高的奖励值. 展开更多
关键词 强化学习 策略梯度 延迟更新 最大熵 演员评论家网络
下载PDF
基于Spark平台的ALS加速算法研究 被引量:1
2
作者 贾晓芳 桑国明 祁文凯 《计算机工程》 CAS CSCD 北大核心 2020年第2期103-109,共7页
协同过滤推荐算法在推荐系统中发挥着重要作用,但其存在执行效率与排名精度较低的问题,交替最小二乘(ALS)算法可实现并行计算,从而提高执行效率,但是该算法数据加载与迭代收敛的时间较长。为此,将非线性共轭梯度(NCG)算法与ALS算法相结... 协同过滤推荐算法在推荐系统中发挥着重要作用,但其存在执行效率与排名精度较低的问题,交替最小二乘(ALS)算法可实现并行计算,从而提高执行效率,但是该算法数据加载与迭代收敛的时间较长。为此,将非线性共轭梯度(NCG)算法与ALS算法相结合,提出一种ALS-NCG算法,以达到加速ALS算法的目的。在Spark分布式数据处理环境中对ALS-NCG算法进行性能评估,实验结果表明,相比ALS算法,ALS-NCG算法获取高精度推荐排名时需要的迭代次数与时间更少。 展开更多
关键词 协同过滤 推荐算法 交替最小二乘算法 非线性共轭梯度 Spark平台
下载PDF
蜂蛹提取物对顺铂诱导小鼠肾损伤的保护作用试验 被引量:2
3
作者 杨绍伟 冯玄 +6 位作者 兰新强 熊潇然 祁文凯 谷智聪 赵芳 李剑美 赵锋 《中国兽医杂志》 CAS 北大核心 2020年第1期116-120,124,共6页
蜂蛹具有抗氧化、降血糖、抗衰老、抗炎等多种功效,为研究蜂蛹提取物对顺铂(LDDP)诱导小鼠肾损伤的保护作用,本试验以云南胡蜂蜂蛹提取物为原料,测定了提取物中蛋白对超氧自由基及DPPH自由基的清除活性。通过构建顺铂诱导的小鼠肾损伤模... 蜂蛹具有抗氧化、降血糖、抗衰老、抗炎等多种功效,为研究蜂蛹提取物对顺铂(LDDP)诱导小鼠肾损伤的保护作用,本试验以云南胡蜂蜂蛹提取物为原料,测定了提取物中蛋白对超氧自由基及DPPH自由基的清除活性。通过构建顺铂诱导的小鼠肾损伤模型,测定血清及组织超氧化物歧化酶(SOD)、谷胱甘肽过氧化物酶(GSH-Px)、脂质过氧化物丙二醛(MDA)、肌酐(Cr)和尿素氮(BUN)的活性或含量,对小鼠肾脏进行组织切片染色分析。结果显示,当蜂蛹提取物浓度达到200 mg/mL时,其DPPH自由基清除率达到57%,最大氧自由基清除率接近97%,蜂蛹提取物具有良好的自由基清除活性,且自由基清除能力具有剂量依赖效应;与顺铂组相比,蜂蛹组中血清SOD和GSH-Px含量均升高约2倍,MDA、Cr、BUN含量均显著降低(P<0.05);结合肾脏组织切片H.E.染色分析,蜂蛹组小鼠肾脏组织的透明细胞和炎性细胞浸润现象有所改善,其损伤程度明显减轻。表明蜂蛹提取物可以减轻顺铂诱导的组织病理损伤,对小鼠肾损伤具有保护作用。 展开更多
关键词 蜂蛹提取物 顺铂 肾损伤 抗氧化作用
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部