-
题名面向大规模数据的分层近邻传播聚类算法
被引量:14
- 1
-
-
作者
刘晓楠
尹美娟
李明涛
姚东
陈武平
-
机构
解放军信息工程大学
数学工程与先进计算国家重点实验室
信息保障技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2014年第3期185-188,192,共5页
-
基金
信息保障技术重点实验室开放基金(KJ-12-04)资助
-
文摘
近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求。针对此问题,提出了分层近邻传播聚类算法。首先,将待聚类数据集划分为若干适合AP算法高效执行的子集,分别推举出各个子集的聚类中心;然后对所有子集聚类中心再次执行AP聚类,推举出整个数据集的全局聚类中心;最后根据与这些全局聚类中心的相似度对聚类样本进行划分,从而实现对大规模数据的高效聚类。在真实和模拟数据集上的实验结果均表明,与AP聚类和自适应AP聚类相比,该方法在保证较好聚类效果的同时,极大地降低了聚类的时间消耗。
-
关键词
数据聚类
近邻传播
分层推举
聚类中心
-
Keywords
Data clustering
Affinity propagation
Hierarchical selecting
Clustering center
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-