期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
K-Means算法最优聚类数量的确定 被引量:25
1
作者 何选森 何帆 +1 位作者 徐丽 樊跃平 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第6期904-912,共9页
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1)需要预先知道聚类的数量;2)对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数... K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1)需要预先知道聚类的数量;2)对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。 展开更多
关键词 有效性评价函数 K-均值聚 最优聚数量 类间质心距离之和 距离之和
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部