-
题名面向高维的共享近邻聚类内部指标
被引量:1
- 1
-
-
作者
张龙义
钟才明
-
机构
宁波大学信息科学与工程学院
宁波大学科学技术学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第S01期93-100,共8页
-
基金
国家自然科学基金面上项目(61976134)。
-
文摘
针对因使用基于距离的相似性度量,传统聚类内部指标随着数据维数的增加而性能下降的问题,提出了一种基于共享近邻相似度的聚类内部指标。首先,利用共享近邻相似度和k最近邻(kNN)方法,估计数据点的密度,构建融合密度的共享近邻相似度图。然后,根据融合密度的共享近邻相似度图,利用最大流算法,计算出类内相似度和类间分离度,并结合两者计算出聚类内部指标。通过对人工数据集和真实数据集的测试表明,与9个基于距离的传统聚类内部指标相比,该指标能更准确评估数据集的最佳划分和预测数据集的最佳类数。因此,该指标处理复杂类结构和高维数据的能力优于所对比的其他聚类内部指标。
-
关键词
聚类内部指标
聚类
共享近邻相似度
高维诅咒
有效性指标
-
Keywords
clustering internal index
clustering
Shared Nearest-Neighbor similarity(SNN)
curse of dimensionality
validity index
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-