一种分裂式的k-means聚类算法被引量：1

A Split K-means Clustering Algorithm

下载PDF

导出

摘要 k-means是一种快速有效的聚类算法,但是随着数据量的增加,k-means算法的局限性日益突出。该文从数据预处理,初始聚类中心的选取,最佳聚类数的确定等几个方面优化了k-means算法。仿真实验表明,优化后的k-means算法在稳定性和准确性方面都有很大的提高,证明提出的算法有一定的价值。 The k-means algorithm is fast and effective.With increasing number of data,the limitations of k-means algorithm have become increasingly prominent.This paper presents an improved k-means algorithm from data preprocessing,initial clustering centers choosing and the best number of clusters' determination for better clustering results.The experiments demonstrate that the improved k-means algorithm has a good performance with stability and accuracy.

作者楼佳王小华

机构地区杭州电子科技大学计算机应用技术研究所

出处《杭州电子科技大学学报（自然科学版）》 2009年第4期54-57,共4页 Journal of Hangzhou Dianzi University：Natural Sciences

关键词聚类数据预处理初始聚类中心 clustering data processing initial clustering center

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1乔小妮,张明新,史变霞.一种基于密度的K-means算法[J].电脑开发与应用,2008,21(10):9-11. 被引量：3
2赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
4袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
5陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量：44
6(美)Pang-NingTan,(美)MichaelSteinbach,(美)VipinKumar著,范明,范宏建等.数据挖掘导论[M]人民邮电出版社,2006.

二级参考文献32

1荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
2袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
3Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND lnt Conf Managemerit on Data, Seattle, Washington, 1998 . 73-84.
4Ester M,Kriegel H P,Sander J.A density-based algorithm tier discovering chlsters in large spatial databases with noise[C]//Proc 2nd Int Conf on Knowledge Discovery and Data Mining.Portland, 1999.20:226-231.
5Treshansky A,McGraw R.An overview of clustering algorithms[A].Proceedings of SPIE,The International Society for Optical Engineering[C].2001(4367):41-51.
6Clausi D A.K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture segmentation[J].Pattern Recognition,2002,35:1959-1972.
7Bezdek J C,Pal N R.Some new indexes of cluster validity[J].IEEE Transactions on Systems,Man,and Cybernetics _ Part B:Cybernetics,1998,28(3):301-315.
8Ramze R M,Lelieveldt B P F,Reiber J H C.A new cluster validity indexes for the fuzzy c-mean[J].Pattern Recognition Letters,1998,19:237-246.
9JiaweiHan MichelineKamber 范明孟小峰译.数据挖掘概念与技术[M].北京：机械工业出版社,2002..
10E M Knorr,R T Ng,V Tucakov. Distance-Based Outliers :Algorithms and Applications[J].VLDB Journal:Very Large Databases,2000:237～253

共引文献342

1段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
2刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
3刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：23
4周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
5韩丽苹,孟海东,李海荣.聚类算法在矿产资源与经济发展关系研究中的应用[J].煤炭技术,2015,34(5):290-292.
6李桃迎,陈燕.一种改进FCM的快速优化算法及其应用[J].大连海事大学学报,2006,32(4):23-27. 被引量：4
7印勇,蒋海娜.优化初始聚类中心的关键帧提取[J].计算机工程与应用,2007,43(21):165-167. 被引量：6
8汪力,冯源,张持健.链状分布的神经网络聚类分析[J].计算机工程与应用,2007,43(26):72-73.
9沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
10郭海湘,诸克军,李玥,王得运.软计算与硬计算融合的中国石油需求预测[J].中国地质大学学报（社会科学版）,2007,7(6):24-28. 被引量：2

同被引文献9

1岳佳,王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息,2006,22(11X):244-246. 被引量：51
2徐明.基于负荷特性分析的错峰方案研究[D].广东:华南理工大学,2012.
3NAGI J,YAP K S,TIONG S K,et al.Nontechnical loss detection for metered customers in power utility using support vector machines[J].IEEE Transactions on Power Delivery,2010,25(2):1162-1171.
4CHICCO G,NAPOLI R,PETAL P.Customer character- ization options for improving the tariff offer[J].IEEE Trans on Power Systems,2003,18(1):381-387.
5BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].NewYork:Plenum Press,1981:100-136.
6郭晓娟,刘晓霞,李晓玲.层次聚类算法的改进及分析[J].计算机应用与软件,2008,25(6):243-244. 被引量：7
7王文生,王进,王科文.SOM神经网络和C-均值法在负荷分类中的应用[J].电力系统及其自动化学报,2011,23(4):36-39. 被引量：15
8周开乐,杨善林.基于改进模糊C均值算法的电力负荷特性分类[J].电力系统保护与控制,2012,40(22):58-63. 被引量：35
9黄永皓,康重庆,夏清,都百青,孟远景,何南强,尚金成,胡左浩.用户分类电价决策方法的研究[J].中国电力,2004,37(1):24-28. 被引量：17

引证文献1

1赵国生,牛贞贞,刘永光,孙超亮.基于自适应模糊C均值聚类算法的电力负荷特性分类[J].郑州大学学报（工学版）,2015,36(6):56-60. 被引量：14

二级引证文献14

1陆惠斌,徐勇,伍宇翔,王宝安,刘恒门.基于换相技术的三相不平衡治理装置研究[J].电力电容器与无功补偿,2016,37(6):64-69. 被引量：22
2杨卓,王利利,杨博,关朝杰,程子霞.不同类型供电区域间典型供电模式过渡方案研究[J].郑州大学学报（工学版）,2017,38(3):54-57. 被引量：2
3张忠会,刘故帅,熊剑峰,刘小宛,徐高超.基于谱聚类算法的城市充换电站分布决策[J].郑州大学学报（工学版）,2017,38(5):32-38. 被引量：2
4康宁宁,李川,曾虎,李英娜.采用FCM聚类与改进SVR模型的窃电行为检测[J].电子测量与仪器学报,2017,31(12):2023-2029. 被引量：27
5荀港益.基于聚类分析与随机森林的短期负荷滚动预测[J].智能城市,2018,4(9):9-11. 被引量：6
6谢伟,赵琦,郭乃网,苏运,田英杰.改进的并行模糊核聚类算法在电力负荷预测的应用[J].电测与仪表,2019,56(11):49-54. 被引量：23
7彭刚,唐松平,曾力,肖云.基于数据挖掘的电网故障关联规则的研究[J].计算机与数字工程,2019,47(9):2369-2374. 被引量：8
8徐春华,陈克绪,马建,刘佳翰,吴建华.基于深度置信网络的电力负荷识别[J].电工技术学报,2019,34(19):4135-4142. 被引量：36
9孙亚璐,张中丹,陆军,毕文瑾,郑伟强,查雯婷.基于可能性c均值聚类和模糊评判的调峰负荷辨识[J].可再生能源,2020,38(12):1647-1653. 被引量：1
10原野,田园.基于DTW层次聚类算法的电力负荷数据特征研究[J].自动化仪表,2020,41(12):96-101. 被引量：9

1施蕾,唐艳琴,张欣星.数据挖掘中决策树方法的研究[J].计算机与现代化,2009(10):29-32. 被引量：13
2刘锋.互联网的分裂和统一[J].互联网周刊,2008(6):76-76.
3张忠平,王爱杰,柴旭光.简单有效的确定聚类数目算法[J].计算机工程与应用,2009,45(15):166-168. 被引量：23
4李红岩,胡林林,王江波,周红芳.基于K-means的最佳聚类数确定方法研究[J].电脑知识与技术,2014(1):110-114. 被引量：3
5blackbird.GNOME与KDE的战争[J].个人电脑,2006,12(2):178-183.
6王宇霞,赵清杰,蔡艺明,王博.基于自重构粒子滤波算法的目标跟踪[J].计算机学报,2016,39(7):1294-1306. 被引量：18
7吴步祺,白小明,张乐.医疗信息发布中k-匿名模型的分析与改进[J].计算机与现代化,2009(10):182-184. 被引量：1
8陈光平,王文鹏,黄俊.一种改进初始聚类中心选择的K-means算法[J].小型微型计算机系统,2012,33(6):1320-1323. 被引量：40
9刘金岭.海量中文短信文本最佳聚类数研究[J].计算机工程,2010,36(8):66-68. 被引量：1
10欧阳浩,肖建华.移动数据预估聚类分析算法[J].计算机工程与应用,2008,44(2):197-201. 被引量：1

杭州电子科技大学学报（自然科学版）

2009年第4期

浏览历史

内容加载中请稍等...

一种分裂式的k-means聚类算法被引量：1

参考文献6

二级参考文献32

共引文献342

同被引文献9

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种分裂式的k-means聚类算法 被引量：1

参考文献6

二级参考文献32

共引文献342

同被引文献9

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种分裂式的k-means聚类算法被引量：1