-
题名融合集群度与距离均衡优化的K-均值聚类算法
被引量:3
- 1
-
-
作者
王日宏
崔兴梅
-
机构
青岛理工大学计算机工程学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第1期104-109,115,共7页
-
基金
国家自然科学基金资助项目(61502262)
山东省研究生教育创新计划项目(SDYY16023)~~
-
文摘
针对传统K-均值算法对初始聚类中心选择较为敏感的问题,提出了一种基于融合集群度与距离均衡优化选择的K-均值聚类(K-MCD)算法。首先,基于"集群度"思想选取初始簇中心;然后,遵循所有聚类中心距离总和均衡优化的选择策略,获得最终初始簇中心;最后,对文本集进行向量化处理,并根据优化算法重新选取文本簇中心及聚类效果评价标准进行文本聚类分析。对文本数据集从准确性与稳定性两方面进行仿真实验分析,与K-均值算法相比,K-MCD算法在4个文本集上的聚类精确度分别提高了18.6、17.5、24.3与24.6个百分点;在平均进化代数方差方面,K-MCD算法比K-均值算法降低了36.99个百分点。仿真结果表明K-MCD算法能有效提高文本聚类精确度,并具有较好的稳定性。
-
关键词
初始聚类中心
K-均值算法
集群度
距离均衡优化
文本聚类
-
Keywords
initial clustering center
K-means algorithm
cluster degree
distance equalization optimization
textclustering
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—控制理论与控制工程]
-