摘要
为解决模糊C-均值(FCM)聚类算法在大数据量中存在的计算量大、运行时间过长的问题,提出了一种改进方法:先用多次随机取样聚类得到的类中心作为FCM算法的初始类中心,以减少FCM算法收敛所需的迭代次数;接着通过数据约减,压缩参与迭代运算的数据集,减少每次迭代过程的运算时间。该方法使FCM算法运算速度大大提高,且不影响算法的聚类效果。
The Fuzzy C-Means (FCM) clustering algorithm requires a long time,due to processing the large data set.This paper presents a method to speed up the FCM algorithm using cluster centers obtained by the multi-times random sampling clustering as the initial cluster centers for the FCM algorithm to reduce the number of iterations required for convergence,and for optimization of the data set to reduce the time for each iteration.This method enormously accelerates the FCM algorithm while maintaining the clustering accuracy.
出处
《计算机工程与应用》
CSCD
北大核心
2007年第10期167-169,共3页
Computer Engineering and Applications
基金
教育部留学回国人员科研启动基金(The Project-sponsored by SRF for ROCS
SEM)
教育部"十五"规划重点项目(No.DCA050056) 。
关键词
模糊聚类分析
模糊C-均值
多次随机取样
数据约减
fuzzy clustering analysis
fuzzy c-means
multi-times random sampling
data reduction