摘要
将线性判别分析和二分K均值聚类耦合在一起,提出了一个适合于高维数据聚类的自适应方法:利用线性判别分析将高维数据集变换成低维数据集,然后在低维数据集上执行二分K均值聚类,并把得到的聚类结果通过一个簇成员指示矩阵H变换到原数据集中.将这样的过程反复进行,直到自适应地得到一个最优结果.基于现实数据集的实验结果证明了该方法的有效性.
Combining linear discriminant analysis(LDA) and bisecting K-means clustering(BKM),an adaptively clustering method was proposed for high dimensional data.The method uses LDA to transform the high dimensional dataset into low dimensional one,applies BKM on the low dimensional dataset,and constructs the clusters in the original high dimensional dataset.The method is adaptively executed to generate the best result.Extensive experimental results on real-world datasets showed the effectiveness of the approach.
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2011年第2期106-110,共5页
Journal of Zhengzhou University of Light Industry:Natural Science
基金
陕西省自然科学基金项目(2010JM8039)
关键词
维归约
线性判别分析
二分K均值
高维数据自适应聚类方法
dimension reduction
LDA
bisecting K-means
adaptive clustering method for high dimensional data