基于Leader的K均值改进算法被引量：3

Improved K-means clustering algorithm based the Leader algorithm

导出

摘要研究了K均值算法中初始聚类中心的选择对算法本身聚类精度及效率的影响,并提出了改进的算法(LK算法,Leader+K-means).LK算法中的初始聚类中心选择不是随机的,而是利用Leader算法得到若干个初始类中心,然后选择包含数据项最多的k个类中心,作为K均值算法的初始类中心.实验结果表明,LK算法在聚类结果的稳定性和正确率方面都是有效可行的. By researching in the relations between the initial means of clusters and the efficiency of clustering, the improved K - means clustering algorithm （ the LK algorithm, Leader ＋ K - means） is proposed. The LK algorithm is better since the initial means is not random selected. At first, it gains several initial means by means of the Leader algorithm, and then selects the k means containing the most data items regarded as the initial means. According to the experiment, the improved K -means clustering algorithm can get higher stability and accuracy .

作者张琼张莹白清源谢丽聪谢伙生

机构地区福州大学数学与计算机科学学院

出处《福州大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第4期493-496,共4页 Journal of Fuzhou University(Natural Science Edition)

基金福建省教育厅科研资助项目(JB07022 JB06023) 福州大学科技发展基金资助项目(2006-XQ-22 XRC-0511)

关键词聚类 K均值算法 Leader算法 clustering K - means algorithm Leader algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
2周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：72
3张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：57
4Asharaf S. A rough fuzzy approach to Web usage categorization[ J]. Fuzzy Sets and Systems, 2004, 148 (1) :119 - 129.

二级参考文献15

1吴景岚,朱文兴.基于K均值的迭代局部搜索聚类算法[J].计算机工程与应用,2004,40(22):37-41. 被引量：8
2HanJ KamberM.数据挖掘概念与技术[M].北京:机械工业出版社,2002..
3KUMAR M, ORLIN JB, PATEL NR. Clustering data with measurement errors[ R]. Technical Report, RRR 12 - 2005, New Jersey:RUTCOR, Rutgers Center for Operations Researeh, 2005.
4SU MC. A modified version for k-means[ J]. IEEE Transactions onPattern Analysis and Machine Intelligence, 2001, 23 (6) : 674 -680.
5FAYYAD U, REINA C, BRADLEY PS. Initialization of interative refinement clustering algorithms[ A]. Proceedings of Fourth International Conference on Knowledge Discovery and Data Mining[ C].Menlo Park: AAAI Press, 1998. 194 - 198.
6CHAUDHURI D, CHAUDHURI BB. A novel muhiseed nonhierarchical data clustering technique[ J]. IEEE Transactions on Systems,Man and Cybernetics: PartB, 1997, 27(5) : 871 - 877.
7La Jolla. Alternatives to the k-means algorithm that find better clustering. Department of Computer Science and Engineering,University of California,San Diego,CA92093
8Kaufan L,Rousseeuw PJ.Finding Groups in Data:an Introduction to Cluster Analysis[M].New York:John Wiley & Sons, 1990
9Guha S,Rastogi R,Shim K.CURE:an efficient clustering algorithm for large databases[C].In:Haas LM,Tiwary A eds.Proceedings of the ACM SIGMOD International Conference on Management of Data,Seattle: ACM Press, 1998: 73～84
10Agrawal R,Gehrke J,Gunopolos D et al. Automatic subspace clustering of high dimensional data for data mining application[C].In:Haas LM,Tiwary A eds. Proceedings of the ACM SIGMOD International Conference on Management of Data, Seattle: ACM Press, 1998: 94～105

共引文献171

1周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
2楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
3王芳,高晓路,许泽宁.基于街区尺度的城市商业区识别与分类及其空间分布格局——以北京为例[J].地理研究,2015,34(6):1125-1134. 被引量：69
4孟海涛,陈笑蓉.基于模糊相似度的科技文献软聚类算法[J].贵州大学学报（自然科学版）,2007,24(2):175-178. 被引量：9
5印勇,蒋海娜.优化初始聚类中心的关键帧提取[J].计算机工程与应用,2007,43(21):165-167. 被引量：6
6汪力,冯源,张持健.链状分布的神经网络聚类分析[J].计算机工程与应用,2007,43(26):72-73.
7沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
8徐克圣,王澜.一种自动获得k值的聚类算法[J].大连交通大学学报,2007,28(4):68-71. 被引量：3
9单世民,于红,张业嘉诚,刘馨月.基于最近共享邻居节点的K-means聚类算法[J].计算机工程与应用,2008,44(6):178-181. 被引量：2
10连凤娜,吴锦林,唐琦.一种改进的K-means聚类算法[J].电脑与信息技术,2008,16(1):38-40. 被引量：23

同被引文献24

1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
2张驰原.谈Clustering系列[EB/OL].(2008-12-29)http://blog.pluskid.org.
3CAO F Y,LIANG J Y,JIANG G.An initialization method for the K-means algorithm using neighborhood model[J].Com- puters&Mathematics with Applications, 2009,58(3) : 474-483.
4Forgy E. Cluster analysis of multivariate data:Efficiency vs.interpret ability of classifications[J].{H}BIOMETRICS,1965,(03):768.
5Maequeen. Some methods for classifieation and analysis of multivariate observations[A].1967.281-297.
6Anil K J. Data clustering:50 years beyond K-Means[J].{H}Pattern Recognition Letters,2010,(08):651-666.
7Ahm ady fard A lireza. M odares Ham idreza[A].Tehran:IEEE Press,2008.
8Hai-xiang Guo,Ke-jun Zhu,Si-wei Gao. An improved genetic K-means algoithm for optimal clustering[A].Leipzig:IEEE Press,2006.
9P.S.Bradley. Refining initial Points for K-Means clustering[A].1998.91-99.
10Nittel S,Kelvin T L,Braverman A. Scaling clustering algorithms for massive data sets using data streams[A].2004.830.

引证文献3

1屈新怀,高万里,丁必荣,李朕.基于聚类数和初始值的K-means算法改进研究[J].组合机床与自动化加工技术,2011(4):42-46. 被引量：6
2詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76. 被引量：2
3翟东海,聂洪玉,崔静静,杜佳.基于自适应簇中心选择的文本聚类算法研究[J].成都信息工程学院学报,2013,28(6):617-622. 被引量：1

二级引证文献9

1杨萍,郭春阳,李翠明.基于K-means聚类算法的群体机器人聚集队形控制[J].组合机床与自动化加工技术,2012(8):89-92.
2邢长征,谷浩.基于平均密度优化初始聚类中心的k-means算法[J].计算机工程与应用,2014,50(20):135-138. 被引量：32
3沈天跃,章守宇,沈蔚,汪振华.现场海域人工鱼礁分布状态聚类分析[J].水产学报,2015,39(9):1350-1358. 被引量：10
4李兰英,董义明,孔银,周秋丽.改进K-means算法的MapReduce并行化研究[J].哈尔滨理工大学学报,2016,21(1):31-35. 被引量：7
5王洪峰,李铁军,赵龙.倾斜摄影实景三维单体化模型自适应聚类算法[J].应用科技,2017,44(2):35-39. 被引量：6
6徐鹏程,王诚.K-Means算法改进及基于Spark计算模型的实现[J].南京邮电大学学报（自然科学版）,2017,37(4):113-118. 被引量：11
7李栋,刘萌萌,郭莎.基于改进的K_means算法在图像分割中的应用[J].电脑知识与技术（过刊）,2016,22(3X):166-168. 被引量：1
8韩建平.基于遥感影像的青海省环境变化监测[J].测绘通报,2021(10):123-126. 被引量：3
9丁娇.基于混合编程的高性能数据通信方法[J].现代信息科技,2024,8(3):50-53.

1殷钢,苗夺谦,段其国.一种新的粗糙Leader聚类算法[J].计算机科学,2009,36(5):203-205. 被引量：6
2张琼.基于粗糙集的改进Leader聚类算法[J].江苏师范大学学报（自然科学版）,2015,33(4):50-52. 被引量：1
3刘顺来.基于聚类分析的Web信息搜索算法研究[J].电脑与电信,2007(6):53-56.
4郭淑红,雷梁.基于聚类的Web用户访问模式的算法研究[J].信阳师范学院学报（自然科学版）,2009,22(1):137-141.
5吴迅兮.基于模板匹配和光流法的图像配准方法[J].无锡职业技术学院学报,2010,9(6):43-45. 被引量：2
6赵湘宁.一种基于长链竞争机制的传感器网络能量空洞研究算法[J].计算机科学,2016,43(7):125-130. 被引量：3
7曹棣,孔晓斌.基于改进Leader算法的Web存取模式的聚类[J].太原科技大学学报,2011,32(3):189-192.
8刘海峰,刘守生,张学仁.聚类模式下一种优化的K-means文本特征选择[J].计算机科学,2011,38(1):195-197. 被引量：12
9隋玉敏,孙秀芳,武优西,任志考.负投影梯度的特征权重Leader聚类算法[J].小型微型计算机系统,2014,35(9):2147-2150. 被引量：2
10张琼,张莹,白清源,谢丽聪,谢伙生.一种新的基于粗糙集的leader聚类算法[J].计算机科学,2008,35(3):177-179. 被引量：4

福州大学学报（自然科学版）

2008年第4期

浏览历史

内容加载中请稍等...

基于Leader的K均值改进算法被引量：3

参考文献4

二级参考文献15

共引文献171

同被引文献24

引证文献3

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于Leader的K均值改进算法 被引量：3

参考文献4

二级参考文献15

共引文献171

同被引文献24

引证文献3

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于Leader的K均值改进算法被引量：3