期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
Rayleigh分布总体参数的均值填补估计和检验 被引量:1
1
作者 赵志文 何静花 杨慧超 《佳木斯大学学报(自然科学版)》 CAS 2016年第2期285-288,共4页
基于均值填补缺失数据方法,研究Rayleigh分布总体参数的极大似然估计问题及两个Rayleigh分布总体参数相等的假设检验问题,证明了基于均值填补数据的极大似然估计的强相合性以及渐近正态性,给出了检验两总体参数相等的检验统计量以及检... 基于均值填补缺失数据方法,研究Rayleigh分布总体参数的极大似然估计问题及两个Rayleigh分布总体参数相等的假设检验问题,证明了基于均值填补数据的极大似然估计的强相合性以及渐近正态性,给出了检验两总体参数相等的检验统计量以及检验统计量的极限分布. 展开更多
关键词 数据缺失 均值填补 极大似然估计 假设检验
下载PDF
基于PCA的近邻均值填补优化算法 被引量:1
2
作者 谢霖铨 毕永朋 廖龙龙 《软件导刊》 2018年第6期67-69,76,共4页
均值填补是常用的数据填补方式,但往往忽略了相邻变量之间的相互关系,又对噪声数据极为敏感。将主成份分析算法应用到均值填补算法中,提取相邻各属性的特征重要度,并采用属性重要度作为权重,以均值填补的计算方式算出缺失数据相邻矩阵... 均值填补是常用的数据填补方式,但往往忽略了相邻变量之间的相互关系,又对噪声数据极为敏感。将主成份分析算法应用到均值填补算法中,提取相邻各属性的特征重要度,并采用属性重要度作为权重,以均值填补的计算方式算出缺失数据相邻矩阵的加权平均值,将其作为相邻属性对于均值填补的影响偏移值,加入到均值填补的均值计算中。通过对UCI数据集的仿真实验可知,基于PCA改进的算法填补的准确性明显优于均值填补算法。 展开更多
关键词 近邻均值填补 主成分分析 特征重要度 偏移值
下载PDF
卫生项目评价指标缺失值均值填补的效果评价 被引量:3
3
作者 李伟栋 刘慧燕 +4 位作者 肖晚晴 尹敏娜 郭勇 杨丽 邱琇 《中国妇幼保健》 CAS 北大核心 2014年第24期3871-3874,共4页
目的:探索均值填补方法在卫生项目评价指标值缺失中的应用并评价其填补效果。方法:通过秩和比评价法和Spearman相关系数比较评价均值填补法对实例卫生项目评价指标缺失值处理后填补结果的合理性。结果:3种方法的秩和比评价结果差异均有... 目的:探索均值填补方法在卫生项目评价指标值缺失中的应用并评价其填补效果。方法:通过秩和比评价法和Spearman相关系数比较评价均值填补法对实例卫生项目评价指标缺失值处理后填补结果的合理性。结果:3种方法的秩和比评价结果差异均有统计学意义(P<0.05),但评价指标缺失值数据的评价排序与2012年对应区卫生绩效排序结果差异较大,项目平均进度替代法的参与区评价排序与对应区卫生绩效排序结果一致(γs=0.761,P<0.05)。结论:卫生项目中指标值缺失会对秩和比评价的结果产生偏性,均值填补是一种简单有效的处理秩和比分析方法中指标值缺失的方法。 展开更多
关键词 卫生项目 秩和比 均值填补
原文传递
电站锅炉缺失数据的遗传自适应填补方法 被引量:2
4
作者 任志伟 黄景涛 +1 位作者 罗威 江爱朋 《兰州理工大学学报》 CAS 北大核心 2013年第2期75-79,共5页
为提高燃烧效率及降低污染排放,基于运行数据的建模与优化是一种有效途径,但现场运行数据因传感器故障或传输失败等原因不可避免地存在缺失值,进而导致信息不完备,无法直接进行建模与优化.针对这一问题,采用一种基于时间相关性的缺失值... 为提高燃烧效率及降低污染排放,基于运行数据的建模与优化是一种有效途径,但现场运行数据因传感器故障或传输失败等原因不可避免地存在缺失值,进而导致信息不完备,无法直接进行建模与优化.针对这一问题,采用一种基于时间相关性的缺失值填补算法,基于线性插值原理对平稳运行过程的缺失数据进行填补;针对非平稳运行工况,提出一种类平均值填补算法,并对其分类结果进行加权修正,进一步提高填补准确性;在此基础上,提出一种基于遗传算法的自适应加权类平均值填补方法,并在实际数据上进行测试分析,结果表明该方法具有更高的填补准确率. 展开更多
关键词 电站锅炉 缺失值填补 均值填补 遗传算法 自适应加权
下载PDF
一种用于光伏电站数据采集系统的数据处理方法 被引量:6
5
作者 张海宁 张节潭 +4 位作者 杨立滨 杜贵兰 赵越 杨晟 赵争鸣 《电器与能效管理技术》 2016年第6期8-13,共6页
随着光伏电站的发展,光伏电站数据质量和数据处理问题对电站运行效率起到至关重要的作用。针对光伏电站数据采集系统采集数据的质量低,数据不完善等问题,构建了针对光伏电站数据采集系统的数据处理模型。通过分析异常数据类型,分别用判... 随着光伏电站的发展,光伏电站数据质量和数据处理问题对电站运行效率起到至关重要的作用。针对光伏电站数据采集系统采集数据的质量低,数据不完善等问题,构建了针对光伏电站数据采集系统的数据处理模型。通过分析异常数据类型,分别用判断域值和变量联合匹配的方法对其进行修正,然后处理缺失值,根据它们与不完全变量的关系,将缺失值分为随机和非随机两类。分别运用热卡填充法、多项式填补和均值填补等方法对缺失值进行填补,完成对光伏电站的数据处理,提高了光伏电站数据采集系统存储数据的质量和光伏电站数据的二次利用价值。 展开更多
关键词 光伏电站 变量联合匹配 热卡填充法 多项式填补 均值填补
下载PDF
样本残缺状态下数据处理方法的研究 被引量:1
6
作者 殷娟娟 《信息与电脑》 2019年第10期157-158,164,共3页
由于人为疏忽或设备限制等多种原因,现实中的数据在收集过程中表达的信息不完整,残缺样本给数据挖掘和决策造成不便。为了得到理想的完整数据集,需要处理、填补数据集,使其成为完整数据集。针对数据残缺的不同机制和填补方法,分析各自... 由于人为疏忽或设备限制等多种原因,现实中的数据在收集过程中表达的信息不完整,残缺样本给数据挖掘和决策造成不便。为了得到理想的完整数据集,需要处理、填补数据集,使其成为完整数据集。针对数据残缺的不同机制和填补方法,分析各自方法的适用场景,从而总结、比较不同方法的填补效果。结果表明,残缺率越大填补效果越差,随机填补方法的稳定性较差,回归填补方法的效果更好。 展开更多
关键词 均值填补 随机填补 EM填补 回归填补
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部