期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
LKNNI:一种局部K近邻插补算法 被引量:5
1
作者 杨日东 李琳 +1 位作者 陈秋源 周毅 《中国卫生统计》 CSCD 北大核心 2019年第5期780-783,共4页
目的针对K近邻插补法在缺失率较大的数据集上的性能不佳,提出一种局部K近邻插补法。方法在6个完整的公开数据集上按照不同缺失率随机删除数据,根据填充数据和原始数据计算算法的填充性能,将局部K近邻插补法与K近邻插补法、多重插补法对... 目的针对K近邻插补法在缺失率较大的数据集上的性能不佳,提出一种局部K近邻插补法。方法在6个完整的公开数据集上按照不同缺失率随机删除数据,根据填充数据和原始数据计算算法的填充性能,将局部K近邻插补法与K近邻插补法、多重插补法对比。结果局部K近邻插补法在缺失率较低的条件下,填充性能与多重插补法接近,且略胜于K近邻插补法。在缺失率较高的条件下,局部K近邻插补法的性能明显优于K近邻插补法,且略胜于多重插补法。结论相比K近邻插补法,局部K近邻插补法非常适合处理缺失率较大的数据集。 展开更多
关键词 k近邻插补 多重 缺失率
下载PDF
MN-LKNNI:融合互近邻降噪的局部动态K近邻插补算法 被引量:1
2
作者 陈舒扬 王波 《软件导刊》 2021年第11期95-99,共5页
为减少数据集自带噪声和假近邻噪声两类噪声数据对K近邻插补算法准确性的影响,提出一种融合互近邻降噪的局部动态K近邻插补算法MN-LKNNI。针对缺失数据对样本进行局部投影切片,将互近邻与局部投影算法相结合,减少噪声数据对数据集的分... 为减少数据集自带噪声和假近邻噪声两类噪声数据对K近邻插补算法准确性的影响,提出一种融合互近邻降噪的局部动态K近邻插补算法MN-LKNNI。针对缺失数据对样本进行局部投影切片,将互近邻与局部投影算法相结合,减少噪声数据对数据集的分布干扰;采用动态求K值参数的方法减少远距离近邻噪声的干扰,以寻找与缺失样本更相似的局部样本。分别在3个数据集和10%、20%、30%、40%、50%的缺失率下进行实验,比较MN-LKNNI、LKNNI和KNNI 3种算法的均方误差和准确率。结果表明,MN-LKNNI算法在缺失率较低的情况下相当或优于LKNNI,在缺失率较高时明显优于LKNNI和KNNI,并且具有一定的稳定性。MN-LKNNI算法通过降低噪声数据的影响,在提升缺失数据集的插补准确性上较KNNI和LKNNI两种算法性能更优。 展开更多
关键词 k近邻插补 近邻 动态参数 缺失数据
下载PDF
不同缺失比例下的缺失值插补方法比较
3
作者 单锐 杨婧 +1 位作者 朱文元 王芳 《信息技术》 2023年第12期52-56,共5页
现实中获得的数据集往往存在缺失值,为了研究不同缺失值插补方法在不同缺失比例下的插补效果,文中选择数值型和混合型的完整数据集,设置不同的缺失比例,分别使用均值插补、K近邻插补、多变量特征插补、随机森林插补四种方法对其进行插补... 现实中获得的数据集往往存在缺失值,为了研究不同缺失值插补方法在不同缺失比例下的插补效果,文中选择数值型和混合型的完整数据集,设置不同的缺失比例,分别使用均值插补、K近邻插补、多变量特征插补、随机森林插补四种方法对其进行插补,并使用决策树分类器拟合填补后的数据集,通过计算分类精度比较四种方法的填补效果。实验结果表明,在缺失比例不大于50%时,多变量特征插补和随机森林插补方法在数值型和混合型数据集上的插补效果优于其他两种方法。 展开更多
关键词 数据缺失 均值 k近邻插补 多变量特征 随机森林
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部