-
题名基于PCA的H-K聚类算法研究
被引量:3
- 1
-
-
作者
何莹
秦亮曦
-
机构
广西大学计算机与电子信息学院
-
出处
《微计算机信息》
2012年第6期163-165,共3页
-
文摘
传统的H-K聚类算法将层次聚类算法和k-means聚类算法有机结合起来,从而使得H-K聚类算法具有单个聚类算法所不具有的诸多优点。为了将H-K聚类算法更好地应用于对高维数据集的聚类中,以缓解维度灾难问题,本文应用PCA(主成分分析)方法对H-K算法进行改进,提出新的聚类算法PCAHK。该算法首先采用PCA方法,将高维数据投影到较低维空间中,再对降维后的数据进行H-K聚类。实验表明,在对高维数据集进行聚类时,与传统的H-K算法相比,PCAHK算法的性能明显提高。
-
关键词
聚类
高维数据集
pcahk
轮廓系数
-
Keywords
Clustering
High-dimensional data sets
pcahk
Silhouette index
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-