期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Spark的改进K-means算法的并行实现 被引量:13
1
作者 杜佳颖 段隆振 +1 位作者 段文影 卜秋瑾 《计算机应用研究》 CSCD 北大核心 2020年第2期434-436,497,共4页
针对K-means聚类算法存在的不足,提出了改进K-means来提高算法的性能,利用简化后的轮廓系数作为评估标准衡量K-means算法中k值,采用K-means++完成K-means算法初始中心点的选择。设置好k值以及初始中心点后使用形态学相似距离作为相似度... 针对K-means聚类算法存在的不足,提出了改进K-means来提高算法的性能,利用简化后的轮廓系数作为评估标准衡量K-means算法中k值,采用K-means++完成K-means算法初始中心点的选择。设置好k值以及初始中心点后使用形态学相似距离作为相似度测量标准将数据点归属到距离最近的中心点形成的簇中,最后计算平均轮廓系数确定合适的k值,并在Spark上实现算法并行化。通过对四个标准数据集在准确性、运行时间和加速比三个方面的实验表明,改进后的K-means算法相对于传统的K-means和SKDK-means算法不仅提高了聚类划分质量,缩短了计算时间,而且在多节点的集群环境下表现出了良好的并行性能。实验结果分析出提出的改进算法能有效提高算法执行效率和并行计算能力。 展开更多
关键词 聚类算法 简化轮廓系数 形态学相似距离 相似性度量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部