-
题名结合自然和共享最近邻的密度峰值聚类算法
被引量:7
- 1
-
-
作者
柏锷湘
罗可
罗潇
-
机构
长沙理工大学计算机与通信工程学院
国网上海电力公司
-
出处
《计算机科学与探索》
CSCD
北大核心
2021年第5期931-940,共10页
-
基金
国家自然科学基金(11671125,51707013)。
-
文摘
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳。针对这些问题,提出一种密度峰值聚类改进算法。该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中。改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较。实验结果表明,提出的算法在性能方面有明显提升。
-
关键词
密度峰值聚类算法
自然最近邻
共享最近邻
-
Keywords
density peak clustering algorithm
natural nearest neighbor
shared nearest neighbor
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-