-
题名基于加权核密度估计与微簇合并的密度峰值聚类算法
- 1
-
-
作者
李智冈
吕莉
谭德坤
康平
樊棠怀
-
机构
南昌工程学院信息工程学院
南昌工程学院南昌市智慧城市物联感知与协同计算重点实验室
-
出处
《信息与控制》
CSCD
北大核心
2024年第3期302-314,共13页
-
基金
国家自然科学基金项目(62066030)
江西省教育厅科技项目(GJJ201915,GJJ2201803)
江西省重点研发计划项目(20192BBE50076,20203BBGL73225)
-
文摘
密度峰值聚类(DPC)算法作为一种基于密度的聚类算法,因其简单高效而得到广泛应用,但DPC算法易将一个高密度类簇划分为多个类簇且极易产生分配连带错误。对此,提出了基于加权核密度估计与微簇合并的密度峰值聚类算法(WEMCM-DPC),利用核密度估计和加权K近邻重新定义局部密度,缩小高密度类簇和稀疏类簇的局部密度差异,使类簇中心的识别更加准确;提出了新的微簇间相似性度量准则,减少数据集中过于稀疏或密集样本对其他样本的影响,为微簇合并提供了依据,并且改善了DPC算法的分配连带错误,使聚类结果更加准确。密度分布不均数据集和真实数据集的实验结果表明,WEMCM-DPC算法的聚类结果优于DPC和4个改进算法。
-
关键词
密度峰值
聚类
核密度估计
K近邻
微簇合并
-
Keywords
density peaks
clustering
kernel density estimation
K-nearest neighbor
micro-cluster merging
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名密度峰值聚类算法研究综述
被引量:2
- 2
-
-
作者
王森
邢帅杰
刘琛
-
机构
华东交通大学理学院
-
出处
《华东交通大学学报》
2023年第1期106-116,共11页
-
基金
江西省自然科学基金项目(20192ACBL20010)。
-
文摘
密度峰值聚类(DPC)是一种新提出的基于密度和距离的聚类算法,由于其原理简单,无需迭代和能处理形状数据集等优点,正在数据挖掘领域得到广泛应用。但DPC算法也有着一定的缺陷,如:对截断距离参数敏感,初始聚类中心的选择非自动化,后续标签分配存在链式问题,时间复杂度较高等。文章对DPC算法的研究现状进行了总结与整理,首先介绍了DPC的算法原理和流程;其次,针对DPC算法的不足对DPC算法的优化进行概括和分析,指出了优化算法的核心技术以及优缺点;最后,对DPC算法未来可能面对的挑战和发展趋势进行展望。
-
关键词
聚类算法
密度峰值
截断距离
初始聚类中心
微簇合并
时间复杂度
-
Keywords
clustering algorithm
density peak
cutoff distance
initial cluster center
micro-cluster merge
time complexity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-