期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
带权值数据流滑动窗口随机抽样算法的改进 被引量:3
1
作者 张龙波 李战怀 +1 位作者 余敏 蒋芸 《计算机工程与应用》 CSCD 北大核心 2007年第25期18-20,共3页
通过改进加权抽样算法,结合基本窗口技术,提出了两种面向带权值数据流上连续更新滑动窗口的随机抽样算法:WRSB算法和IWRSB算法。当新的数据元组到达时,根据数据元组的权值计算出该元组的键值,根据元组键值的大小决定其是否进入样本集以... 通过改进加权抽样算法,结合基本窗口技术,提出了两种面向带权值数据流上连续更新滑动窗口的随机抽样算法:WRSB算法和IWRSB算法。当新的数据元组到达时,根据数据元组的权值计算出该元组的键值,根据元组键值的大小决定其是否进入样本集以及样本集中被替换的数据元组,同时设置一个系统缓冲区来保存最近到达的键值较大的部分数据元组,作为过期数据元组的后备,使算法能够有效地处理过期数据元组问题。理论分析和实验结果表明,两种算法都能有效地处理带权值数据流上连续更新滑动窗口的随机抽样问题,相比较而言,IWRSB算法具有更好的性能。 展开更多
关键词 数据流 滑动窗口 概要数据结构 随机抽样算法
下载PDF
等距随机抽样算法在电脑派位中的应用 被引量:1
2
作者 方群 《安徽师范大学学报(自然科学版)》 CAS 2002年第3期224-228,共5页
介绍了等距随机抽样算法的基本原理和算法 ,以及它在中学招生电脑派位中的应用 .通过分析对该算法作出了恰当评价 。
关键词 等距随机抽样算法 电脑派位 循环链表 中小学教育 招生 数据结构
下载PDF
交叉熵随机抽样算法在辽河水质概率区间估算中的应用
3
作者 侯铁铮 《黑龙江水利科技》 2021年第8期186-188,共3页
采用交叉熵随机抽样算法对辽河铁岭段水质概率区间进行了估算,估算结果表明:辽河铁岭段总氮处于IV-III类水质标准浓度的概率区间在0.44-0.49之间,总磷处于IV-III类水质标准浓度的概率区间在0.46-0.56之间。水质上下变幅的最大概率值为0... 采用交叉熵随机抽样算法对辽河铁岭段水质概率区间进行了估算,估算结果表明:辽河铁岭段总氮处于IV-III类水质标准浓度的概率区间在0.44-0.49之间,总磷处于IV-III类水质标准浓度的概率区间在0.46-0.56之间。水质上下变幅的最大概率值为0.45。研究成果对于辽河铁岭段水质预警具有参考意义。 展开更多
关键词 交叉熵 随机抽样算法 水质概率 变动区间估 辽河铁岭段
下载PDF
基于RS_Hash频繁项集的卫星载荷关联规则算法
4
作者 贾澎涛 温滋 《国外电子测量技术》 北大核心 2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。... 遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。 展开更多
关键词 卫星载荷分析 关联规则 频繁项集 动态随机抽样算法 哈希桶
下载PDF
大数据下广义线性模型的参数估计算法 被引量:2
5
作者 李晨露 《系统科学与数学》 CSCD 北大核心 2020年第5期927-940,共14页
在大数据下,全样本量很大,未知参数极大似然估计的计算变得十分困难.文章主要对于广义线性模型参数的极大似然估计研究一种有效的计算方法.首先证明了随机抽样算法下的估计量的渐近正态性,由此提出了入样概率的选取准则及两步随机抽样算... 在大数据下,全样本量很大,未知参数极大似然估计的计算变得十分困难.文章主要对于广义线性模型参数的极大似然估计研究一种有效的计算方法.首先证明了随机抽样算法下的估计量的渐近正态性,由此提出了入样概率的选取准则及两步随机抽样算法.模拟研究表明,绝大部分情况下,运用文章提出的方法所得到广义线性模型极大似然估计量的均方误差低于与之对比的简单随机抽样. 展开更多
关键词 大数据 广义线性模型 两步随机抽样算法 渐近正态性 概率
原文传递
Bayesian Empirical Likelihood Estimation of Quantile Structural Equation Models 被引量:7
6
作者 ZHANG Yanqing TANG Niansheng 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2017年第1期122-138,共17页
Structural equation model(SEM) is a multivariate analysis tool that has been widely applied to many fields such as biomedical and social sciences. In the traditional SEM, it is often assumed that random errors and exp... Structural equation model(SEM) is a multivariate analysis tool that has been widely applied to many fields such as biomedical and social sciences. In the traditional SEM, it is often assumed that random errors and explanatory latent variables follow the normal distribution, and the effect of explanatory latent variables on outcomes can be formulated by a mean regression-type structural equation. But this SEM may be inappropriate in some cases where random errors or latent variables are highly nonnormal. The authors develop a new SEM, called as quantile SEM(QSEM), by allowing for a quantile regression-type structural equation and without distribution assumption of random errors and latent variables. A Bayesian empirical likelihood(BEL) method is developed to simultaneously estimate parameters and latent variables based on the estimating equation method. A hybrid algorithm combining the Gibbs sampler and Metropolis-Hastings algorithm is presented to sample observations required for statistical inference. Latent variables are imputed by the estimated density function and the linear interpolation method. A simulation study and an example are presented to investigate the performance of the proposed methodologies. 展开更多
关键词 Bayesian empirical likelihood estimating equations latent variable models MCMC algo-rithm quantile regression structural equation models.
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部