摘要
聚类分析作为数据挖掘领域的一个关键研究热点,主要涉及数据分组技术。K-means算法作为一种经典的聚类方法,由于其简洁性和高效率而被广泛应用。然而,该算法存在一些明显的缺陷,如聚类中心的随机选择和较慢的收敛速度。文章在分析传统聚类算法的基础上,对K-means++算法进行了深入探讨。K-means++算法的核心思想是在选定后续聚类中心时,综合考虑当前已有聚类中心的分布,从而减少中心点的重叠。实验结果表明,K-means++通过选择更为分散的聚类中心,有效提高了聚类的准确性和算法的收敛速度,在改善聚类效率和精度方面具有显著优势。
出处
《电脑知识与技术》
2024年第17期78-81,共4页
Computer Knowledge and Technology
基金
第五期江苏省职业教育教学改革研究课题:五年制高职创新创业教育课程体系构建的实践研究(以江苏联合职业技术学院扬州分院为例)(项目编号:ZYB376)。