-
题名基于自适应可达距离的密度峰值聚类算法
被引量:6
- 1
-
-
作者
章曼
张正军
冯俊淇
严涛
-
机构
南京理工大学理学院
-
出处
《计算机应用》
CSCD
北大核心
2022年第6期1914-1921,共8页
-
基金
国家自然科学基金资助项目(11671205)。
-
文摘
针对基于快速搜索和发现密度峰值的聚类(CFSFDP)算法中截断距离需要人工选取,以及最近邻分配带来的误差导致的在具有不同密度簇的复杂数据集上的聚类效果不佳的问题,提出了一种基于自适应可达距离的密度峰值聚类(ARD-DPC)算法。该算法利用非参数核密度估计方法计算点的局部密度,根据决策图选取聚类中心,并利用自适应可达距离分配数据点,从而得到最终的聚类结果。在4个合成数据集和6个UCI数据集上进行了仿真实验,将所提算法ARD-DPC与基于快速搜索和发现密度峰值的聚类(CFSFDP)、基于密度的噪声应用空间聚类(DBSCAN)、基于密度自适应距离的密度峰聚类(DADPC)算法进行了比较,实验结果表明,相比其他三种算法,ARD-DPC算法在7个数据集上的标准化互信息(NMI)、兰德指数(RI)和F1-measure取得了最大值,在2个数据集分别取得F1-measure和NMI的最大值,只对模糊度较高、聚类特征不明显的Pima数据集聚类效果不佳;同时,ARD-DPC算法在合成数据集上能准确地识别出聚类数目和具有复杂密度的簇。
-
关键词
聚类算法
密度峰值
截断距离
非参数核密度估计
自适应可达距离
-
Keywords
clustering algorithm
density peak
cutoff distance
non-parametric kernel density estimation
adaptive reachable distance
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-