期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于距离最大化和缺失数据聚类的填充算法 被引量:9
1
作者 赵星 王逊 黄树成 《电子设计工程》 2018年第1期20-24,28,共6页
通过对基于K-means聚类的缺失值填充算法的改进,文中提出了基于距离最大化和缺失数据聚类的填充算法。首先,针对原填充算法需要提前输入聚类个数这一缺点,设计了改进的K-means聚类算法:使用数据间的最大距离确定聚类中心,自动产生聚类个... 通过对基于K-means聚类的缺失值填充算法的改进,文中提出了基于距离最大化和缺失数据聚类的填充算法。首先,针对原填充算法需要提前输入聚类个数这一缺点,设计了改进的K-means聚类算法:使用数据间的最大距离确定聚类中心,自动产生聚类个数,提高聚类效果;其次,对聚类的距离函数进行改进,采用部分距离度量方式,改进后的算法可以对含有缺失值的记录进行聚类,简化原填充算法步骤。通过对STUDENT ALCOHOL CONSUMPTION数据集的实验,结果证明了该算法能够在提高效率的同时,有效地填充缺失数据。 展开更多
关键词 数据清洗 缺失数据填充 K-means填充算法 距离最大化
下载PDF
多目标决策中一种确定权重的方法 被引量:22
2
作者 刘新建 张瑞凤 《山西师范大学学报(自然科学版)》 2002年第3期20-22,共3页
本文提出了一种在多目标决策中确定权重的方法多目标距离最大化法 .它以客观统计的数据为基础 ,在实践中有一定的实用价值 .
关键词 多目标决策 权重 客观方法 综合评价 多目标距离最大化 决策矩阵 多目标最优化模型 指标体系
下载PDF
基于云计算平台Hadoop的HKM聚类算法设计研究 被引量:9
3
作者 张淑芬 董岩岩 陈学斌 《应用科学学报》 CAS CSCD 北大核心 2018年第3期524-534,共11页
为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优... 为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优化,最后用Hadoop云计算平台的Map Reduce编程模型实现算法的并行化.实验结果表明,该算法不仅在聚类结果上具有较高的准确率和稳定性,而且能够很好地解决传统聚类算法在处理大规模数据时所面临的扩展性问题. 展开更多
关键词 K-MEANS算法 样本密度 最大化最小距离 HADOOP平台 并行化计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部