期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于不完备集双聚类的缺失数据填补算法 被引量:12
1
作者 韩飞 沈镇林 《计算机工程》 CAS CSCD 北大核心 2016年第4期20-26,共7页
缺失数据填补是数据清洗领域的一个重要问题。由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法。该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值... 缺失数据填补是数据清洗领域的一个重要问题。由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法。该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值波动一致的特点,对缺失数据进行填补。通过数学分析,把寻找含有缺失值的最大完美簇问题转化为求解缺失对象与其他对象之间的最大相似属性集问题,在相同的最大相似属性集下,以缺失值的众数作为填补值。采用4组UCI数据集进行实验,结果表明,该算法相比ROUSTIDA算法平均提高了77.13%的填补值精确度。 展开更多
关键词 缺失数据填补 不完备 双聚类 最大相似属性集 数据清洗 完美簇
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部