期刊文献+

KNN优化的密度峰值聚类算法 被引量:6

KNN Optimized Density Peak Clustering Algorithm
下载PDF
导出
摘要 针对K-means聚类算法存在初始聚类中心敏感,离群点的检测和去除困难的问题,提出基于K-最近邻(K-Nearest Neighbor,KNN)优化密度峰值的K-means聚类算法(K-Nearest Neighbor of Density Peaks Clustering-K-Means,KDPC-K)。首先利用KNN最近邻思想结合改进的密度函数确定数据样本点局部密度,其次以平均局部密度作为阈值来检测和去除离群点,最后采用一种自适应策略合并相似的聚类簇,获取初始聚类中心。实验在多个UCI数据集和含有噪声的人工数据集上表明,改进的算法与文献中的算法对比,具有更好的抗噪性、鲁棒性和聚类效果。 Aiming at the problem that the K-means clustering algorithm is sensitive to the initial clustering center and difficult to detect and remove outliers,a K-means clustering algorithm based on K-nearest neighbor(KNN)optimized density peak(KDPC-K)is proposed.First,the KNN nearest neighbor idea combined with the improved density function is used to determine the local density of data sample points.Then,the average local density is used as a threshold to detect and remove outliers.Finally,an adaptive strategy is adopted to merge similar clusters to obtain the initial cluster centers.Experiments on multiple UCI data sets and artificial data sets containing noise indicate that the improved algorithm has better noise resistance,robustness and clustering effect compared with the algorithm in the literature.
作者 黄学雨 程世超 HUANG Xueyu;CHENG Shichao(Jiangxi University of Science&Technology,Ganzhou Jiangxi 341000,China)
机构地区 江西理工大学
出处 《通信技术》 2021年第7期1608-1618,共11页 Communications Technology
基金 国家重点研发计划(No.2020YFB1713700)。
关键词 K-最近邻 密度峰值 局部密度 自适应策略 K-MEANS KNN DPC local density adaptive strategy K-means
  • 相关文献

参考文献13

二级参考文献128

共引文献690

同被引文献54

引证文献6

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部