-
题名一种新型高效的无参数化聚类算法
被引量:3
- 1
-
-
作者
陈靖飒
程开丰
吴怀岗
-
机构
南京师范大学计算机科学与技术学院
南京大学电子科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第4期699-703,共5页
-
基金
国家自然科学基金项目(71701090)资助。
-
文摘
为了解决K-means算法对初始聚类数k和初始聚类中心经验参数的依赖问题,提出了一种基于最小生成树的无参数化聚类MNC算法(MST based Non-parameterized Clustering).首先将待聚类数据集抽象成赋权完全图WCG(Weighted Complete Graph),其中的点代表向量,赋权边代表数据间的相似关系;然后将WCG转换成全连通的最小生成树M ST(M inimum Spanning Tree);接着利用k=2的经典K-means算法对M ST边集的一维权重空间进行聚类,得到剪枝的阈值;最后对M ST进行剪枝和噪声过滤,得到的连通分量即为聚类的簇.实验结果表明,相对传统聚类算法,MNC算法不仅能够识别不同形状的数据簇,而且其无参数化的特点可以大大减少聚类时间,提高聚类效率.
-
关键词
无参数化聚类
赋权完全图
最小生成树
一维权重空间
-
Keywords
non-parameterized clustering
weighted complete graph
minimum spanning tree
one-dimensional weight space
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-