-
题名优化初始聚类中心的改进K-means算法
被引量:33
- 1
-
-
作者
唐东凯
王红梅
胡明
刘钢
-
机构
长春工业大学计算机科学与工程学院
长春工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第8期1819-1823,共5页
-
基金
吉林省科技厅发展计划项目(20160415013JH)资助
吉林省科技厅重大科技招标专项(20160203010GX)资助
-
文摘
针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的数据集上,引入取样因子α,得到候选初始中心点集.最后,根据最大最小距离的思想,在候选初始中心点集上选取k个数据对象作为初始聚类中心.实验结果表明,在时间基本相同的情况下,提出的改进算法相对K-means、K-means++算法具有较好的稳定性和较高的聚类准确率,并且聚类的平均迭代次数也相对较小.
-
关键词
K-MEANS算法
初始聚类中心
离群因子
取样因子
最大最小距离
-
Keywords
K-means
initial clustering center
outlier factor
sampling factor
maximum and minimum distance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-