摘要
传统的K-means聚类算法属于典型的基于划分聚类算法,算法的实现过程简单易懂,聚类效果不错,因此被广泛使用。但是,因为传统K-means的初始值是随机选定的,使得聚类结果不稳定,受初始值影响较大。针对上述问题,该文对传统的K-means算法中随机选取初始值改进,对样本值增加进行预处理,首先对样本值多次取数,对采样数据集进行初次K-means运算后获得聚类结果,从聚类结果中取距离最大的k个聚类中心作为初始值。通过Iris数据集对改进算法进行验证,聚类效果有较好的提高。
出处
《电脑知识与技术》
2022年第11期95-97,共3页
Computer Knowledge and Technology
基金
2020年度江苏省工业软件工程技术研究开发中心开放基金项目(ZK20-04-02)。