-
题名去中心化加权簇归并的密度峰值聚类算法
被引量:4
- 1
-
-
作者
赵力衡
王建
陈虹君
-
机构
成都锦城学院电子信息学院
四川大学计算机学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第8期1910-1922,共13页
-
基金
教育部协同育人项目(201902005069)
四川省科技厅重点研发项目(22ZDYF0724)。
-
文摘
快速搜索和寻找密度峰值聚类算法(DPC)是近年来提出的一种基于密度的聚类算法,具有原理简单、无需迭代并能实现任意形状聚类的优点。但该算法仍存在一些缺陷:围绕聚类中心点聚类,使聚类结果受中心点影响显著,且聚类中心点数量仍需人为指定;截断距离仅考虑了数据的分布密度,忽略了数据的内部特征;聚类过程中若有样本存在分配错误,会导致其后续样本聚类出现跟随错误。针对上述问题,尝试提出一种去中心化加权簇归并的密度峰值聚类算法(DCM-DPC)。该算法引入权重系数重新定义了局部密度,并由此划分出位于不同局部高密度区域的核心样本组,用于取代聚类中心点成为聚类的依据。最后将剩余样本按其近邻样本所在类簇的众数,或分配到最高耦合的核心样本组代表的类簇中或标注为离散点以完成聚类。在人工和UCI数据集上的实验结果表明,提出算法的聚类效果优于对比算法,对相互纠缠的类簇的边界样本划分也更加精确。
-
关键词
密度峰值
聚类
去中心点
邻域
簇归并
-
Keywords
density peaks
clustering
decentralized
neighborhood
clusters merging
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-