-
题名基于密度峰值多起始中心的融合聚类算法
被引量:7
- 1
-
-
作者
梅婕
魏圆圆
许桃胜
-
机构
中国科学院合肥物质科学研究院智能机械研究所
中国科学技术大学
安徽省智慧农业工程实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第22期78-85,共8页
-
基金
国家重点研发计划(2017YFD0700501-2)
国家自然科学基金(61902372)
安徽省自然科学基金(2008085QF292,1908085QE202)。
-
文摘
经典K-Means算法不能有效处理非球型数据集的聚类问题,且聚类目标数需预先指定。SMCL(Self-adaptive Multiprototype-based Competitive Learning)算法是一种K-Means的改进算法,它引入Multi-Prototypes机制,并将距离相近的Prototypes所代表的样本簇融合成聚类簇。在SMCL算法基础上提出DP-SMCL(Density Peak-SMCL)算法,使用密度峰值聚类算法确定初始聚类中心集,借助1-D高斯混合概率密度模型合并以Prototypes为中心的相近子簇来获得精确聚类结果。实验结果表明,DP-SMCL算法可应用于非球型数据集聚类,且能自动确认聚类的目标类别数,相比于K-Means和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等经典聚类算法能够获得更加准确的聚类结果。同时,与SMCL算法相比,DP-SMCL可以快速完成初始Prototypes的选定,显著提升算法准确率和执行效率。
-
关键词
K-MEANS
multi-prototypes
聚类
1-D高斯混合概率密度模型
非球型数据集
-
Keywords
K-Means
multi-prototypes
clustering
1-D Gaussian mixture probability density model
aspheric dataset
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-