一种应用复杂网络特征的K-means初始化方法被引量：2

K-means initialization method using properties of complex network

下载PDF

导出

摘要 K-means算法是一种基于划分的聚类算法,具有算法简单且收敛速度快的特点。但该算法的性能依赖于聚类中心的初始位置的选择。拓展了复杂网络的重要特征,针对带有属性的数据对象所构成的数据集,定义了多维属性对象的度、聚集度和聚集系数,选取度和聚集系数高的K个点作为K-means聚类的初始中心点。实验数据表明,改进后的K-means算法较传统的算法具有更高的效率和准确度。 K-means algorithm is a partition-based clustering algorithm.It is simple and fast to converge,the performance of K- means algorithm depends on that how to choose K samples as the initial cluster centers.This paper develops the properties of complex network,and defines degree,congregated degree and congregated coefficient of objects with feature,and chooses the K nodes whose the degree and congregated coefficient are larger than the others as the initial cluster centers.The experiment shows that the improved K-means clustering algorithm is more efficient than the original K-means clustering algorithm.

作者田生文王伊蕾李阿丽

机构地区鲁东大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第6期127-129,共3页 Computer Engineering and Applications

关键词聚类 K—means算法复杂网络特征聚类初始点 clustering K-means complex network characteristics initial cluster centers

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1Han Jia-wei,Kamber M.Data mining:Concepts and techniques[M]. 2nd ed.USA: Morgan Kaufmann Publishers Inc,2001.
2MacQueen J B.Some methods for classification and analysis of multivariate observations[C]//LeCam L M,Neyman J.Proc of the 5th Berkeley Symp on Mathematical Statistics and Probalility. Bekeley: University of California Press, 1967,1 : 281-297.
3Milligan G W.An examination of the effect of six types of error perturbation on fifteen clustering algorithms[J].Psychometrika, 1980, 45(3) :325-342.
4Ward J H.Hierarchical grouping to optimize an objective function[J]. Journal of American Statistical Association, 1963,58:236-244.
5Higgs R E,Bemis K G,Watson I A,et al.Experimental designs for selecting molecules from large chemical databases[J].Journal of Chemical Information and Computer Sciences, 1997,37(5) : 861-870.
6Snarey M,Terrett N K,Willet P,et al.Comparison of algorithms for dissimilarity-based compound selection[J]Journal of Molecular Graphics & Modeling, 1997,15(6) :372-385.
7Kaufman L,Rousseeuw P J.Finding groups in data:An introduction to cluster analysis[M].Canada:John Wiley & Sons,Inc,1990.
8钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
9UCI.Datasets from UCI[EB/OL].(2005-03-23).http://www.sgi.cond tech/mlc/db/iris.all.

二级参考文献12

1Milligan G W.An examination of the effect of six types of error perturbation on fifteen clustering algorithms.Psychometrika,1980,45(3):325～342
2Ward J H.Hierarchical grouping to optimize an objective function.Journal of American Statistical Association,1963,58:236～244
3Higgs R E,Bemis K G,Watson I A,Wikel J H.Experimental designs for selecting molecules from large chemical databases.Journal of Chemical Information and Computer Sciences,1997,37(5):861～870
4Snarey M,Terrett N K,Willet P,Wilton D J.Comparison of algorithms for dissimilarity-based compound selection.Journal of Molecular Graphics & Modelling,1997,15(6):372～385
5Kaufman L,Rousseeuw P J.Finding Groups in Data.An Introduction to Cluster Analysis.Canada:John Wiley & Sons,Inc.,1990
6Ng A Y,Jordan M I,Weiss Y.On spectral clustering:analysis and an algorithm In:Proceedings of Neural Information Processing Systems Conference.2001
7Golub Gene H,Van Loan Charles F.Matrix Computations,3rd edition.London:The Johns Hopkins University Press,1996,405～414
8Rao C R,Rao M B.Matrix Algebra and Its Applications to Statistics.World Scientific,1998.471
9Bapat R B,Rachava T E S.Nonnegative Matirces and Applications.Cambridge University Press,1997.163～164
10Zhao Y,Karypis G.Criterion Functions for Document Clustering:Experiments and Analysis (Technical Report) 2001

共引文献31

1陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
2汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：140
3巩敦卫,蒋余庆,张勇,周勇.基于微粒群优化聚类数目的K-均值算法[J].控制理论与应用,2009,26(10):1175-1179. 被引量：19
4吴景岚.一种基于GRASP的文档聚类算法[J].闽江学院学报,2009,30(5):62-65.
5钟燕飞,张良培.遥感影像K均值聚类中的初始化方法[J].系统工程与电子技术,2010,32(9):2009-2014. 被引量：5
6姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14
7李桃迎,陈燕,秦胜君,李楠.增量聚类算法综述[J].科学技术与工程,2010,10(35):8752-8759. 被引量：7
8张燕平,张娟,何成刚,褚维翠,张利娜.基于佳点集与Leader方法的改进K-means聚类算法[J].计算机应用,2011,31(5):1359-1362. 被引量：3
9岳明道.新型区间数据模糊C-均值聚类算法[J].计算机工程与应用,2011,47(13):157-160. 被引量：4
10仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29

同被引文献90

1李洁,高新波,焦李成.一种基于GA的混合属性特征大数据集聚类算法[J].电子与信息学报,2004,26(8):1203-1209. 被引量：9
2金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：161
3黄永平,邹力鹍.数据仓库中基于密度的批量增量聚类算法[J].计算机工程与应用,2004,40(29):206-208. 被引量：9
4沈洁,林颖,陈志敏,赵敏涯.基于增量式蚁群聚类的用户访问模式挖掘[J].计算机应用,2005,25(7):1654-1657. 被引量：4
5刘靖明,韩丽川,侯立文.一种新的聚类算法——粒子群聚类算法[J].计算机工程与应用,2005,41(20):183-185. 被引量：25
6吴琪,左万利.一种基于距离的增量聚类算法[J].湖南工程学院学报（自然科学版）,2005,15(3):41-44. 被引量：3
7徐新华,谢永红.增量聚类综述及增量DBSCAN聚类算法研究[J].华北航天工业学院学报,2006,16(2):15-17. 被引量：5
8张建华,江贺,张宪超.蚁群聚类算法综述[J].计算机工程与应用,2006,42(16):171-174. 被引量：41
9安中华,安琼.模糊聚类的有效性研究[J].湖北大学学报（自然科学版）,2006,28(3):222-226. 被引量：11
10刘建晔,李芳.一种基于密度的高性能增量聚类算法[J].计算机工程,2006,32(21):76-78. 被引量：12

引证文献2

1李桃迎,陈燕,秦胜君,李楠.增量聚类算法综述[J].科学技术与工程,2010,10(35):8752-8759. 被引量：7
2翟继友,张鹏.高斯混合模型参数估值算法的优化[J].计算机技术与发展,2011,21(11):145-148. 被引量：7

二级引证文献14

1王恩泽,何东健.基于MFCC和双重GMM的鸟类识别方法[J].计算机工程与设计,2014,35(5):1868-1871. 被引量：13
2叶施仁,杨英,杨长春,朱明峰.孤立点预处理和Single-Pass聚类结合的微博话题检测方法[J].计算机应用研究,2016,33(8):2294-2297. 被引量：12
3王清龙,王清凤,袁奎超.有机化学常用化学键的聚类分析[J].化工管理,2016(34):210-211. 被引量：1
4于建均,郑逸加,阮晓钢,赵少琼.基于高斯混合模型的轨迹模仿学习表征参数优化[J].北京工业大学学报,2017,43(5):719-728. 被引量：3
5李春生,宋佳,张可佳,张勇.基于关联度分析的生产异常模式挖掘[J].计算机技术与发展,2017,27(9):124-128.
6许福,徐建.基于组合增量聚类的数据流异常检测研究[J].计算机与数字工程,2017,45(8):1473-1478. 被引量：1
7何玉林,黄哲学.大规模数据集聚类算法的研究进展[J].深圳大学学报（理工版）,2019,36(1):4-17. 被引量：10
8邵俊健,王士同.具有抗噪性能适用高维数据的增量式聚类算法[J].计算机科学与探索,2019,13(9):1553-1566. 被引量：10
9解初,王建东,韩邦磊,王振.基于趋势特征聚类的多元相似时间序列的提取[J].科学技术与工程,2020,20(7):2786-2793. 被引量：8
10范晓东,崔莹,张庆春.基于EM算法的混合线性回归模型的应用研究[J].吉林化工学院学报,2020,37(7):10-12. 被引量：1

1赵鹏,蔡庆生,王清毅,耿焕同.一种基于复杂网络特征的中文文档关键词抽取算法[J].模式识别与人工智能,2007,20(6):827-831. 被引量：44
2赵怿怡,刘海涛.语言网络研究的数学模型——从复杂网络、社会网络到语言网络[J].中文信息学报,2015,29(6):46-53. 被引量：5
3王晓燕,毛红阁.基于复杂网络特征的P2P系统模型的研究[J].赤峰学院学报（自然科学版）,2011,27(1):23-24. 被引量：1
4唐德玉,曹东,杨进.一种改进初始中心点的FCM算法[J].现代计算机（中旬刊）,2016(11):7-11. 被引量：2
5古懋佳.小世界网络模型下的无线传感器网络[J].微型机与应用,2012,31(20):57-59.
6李志明.复杂网络在无线网络中的应用研究[J].河西学院学报,2015,31(5):87-92.
7曹玖新,吴江林,石伟,刘波,郑啸,罗军舟.新浪微博网信息传播分析与预测[J].计算机学报,2014,37(4):779-790. 被引量：109
8赵鹏,蔡庆生,王清毅.一种用于文章推荐系统中的用户模型表示方法[J].计算机技术与发展,2007,17(1):4-5. 被引量：4
9崔宁.基于网络化软件的复杂网络特性实证研究[J].电子技术与软件工程,2015(4):32-32. 被引量：1
10任海鹏,马展峰.基于复杂网络特性的带钢表面缺陷识别[J].自动化学报,2011,37(11):1407-1412. 被引量：12

计算机工程与应用

2010年第6期

浏览历史

内容加载中请稍等...

一种应用复杂网络特征的K-means初始化方法被引量：2

参考文献9

二级参考文献12

共引文献31

同被引文献90

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种应用复杂网络特征的K-means初始化方法 被引量：2

参考文献9

二级参考文献12

共引文献31

同被引文献90

引证文献2

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种应用复杂网络特征的K-means初始化方法被引量：2