期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
K-Means算法改进及基于Spark计算模型的实现 被引量:11
1
作者 徐鹏程 王诚 《南京邮电大学学报(自然科学版)》 北大核心 2017年第4期113-118,共6页
K-Means算法是一种基于划分的算法,具有实现简单、效率较高的特点,但存在对初始中心选取依赖性强、分类数K未必总是已知及算法频繁迭代资源开销大等缺点。为解决这些问题,通过引入Canopy算法和最小最大距离算法对原K-Means算法进行改进... K-Means算法是一种基于划分的算法,具有实现简单、效率较高的特点,但存在对初始中心选取依赖性强、分类数K未必总是已知及算法频繁迭代资源开销大等缺点。为解决这些问题,通过引入Canopy算法和最小最大距离算法对原K-Means算法进行改进,并在大数据的现实背景下,采用Spark并行计算框架来实现该算法。实验结果表明:改进后的聚类算法在分类稳定性、准确性和收敛速度上都有所提升,并在处理大规模数据方面表现出较大的性能优势。 展开更多
关键词 K-MEANS Canopy算法 最小最大距离算法 SPARK
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部