快速查找初始聚类中心的K_means算法被引量：19

K_means Clustering Algorithm with Fast Lookup Initial Start Center

下载PDF

导出

摘要传统的k_means算法对初始聚类中心十分敏感,聚类结果随不同的初始输入而波动,容易陷入局部最优.为消除这种敏感性,针对k_means算法,提出了一种新的基于数据样本分布选取初始聚类中心的方法,对公共数据库UCI里面的数据实验表明改进后的k_means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性. The traditional k_means algorithm has sensitivity to the initial start center.The clustering accuracy of k_means is affected by the initial start center,and it is very easy to sink into the part best.To solve this problem,for k_means method,we give a new method for selecting initial start center based on sample data distribution to improve the clustering accuracy of k_means.Experiments on the standard database UCI show that the proposed method can produce a high accuracy clustering result and eliminate the sensitivity to the initial start centers.

作者曹志宇张忠林李元韬

机构地区兰州交通大学电子与信息工程学院

出处《兰州交通大学学报》 CAS 2009年第6期15-18,共4页 Journal of Lanzhou Jiaotong University

关键词聚类数据样本欧式距离 k_means算法聚类中心 clustering sample data euclid distance k_means algorithm clustering center

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1MacQueen J. Some methods for classification and analysis of multi-variate observations[C]//Proceedings of the 5th Berkeley Symposiumon Mathematical Statistics and Probability, 1967.
2Dhillon I, Guan Y, Kogan J. Refining clusters in high dimensional data[C] // Arlington: The 2nd SIAM ICDM, Workshop on Clustering High Dimensional Data, 2002.
3Zhang B. Generalized K- harmonic means: dynamic weighting of data in unsupervised learning[C]//Chicago:Proceedings of the 1st SIAM ICDM,2001.
4Pelleg D,Moore A. X-means: extending K-means with efficient estimation of the number of the clusters[C]// Proceedings of the 17th ICML, 2000.
5Sarafis I,Zalzala A M S, Trinder PW. A genetic rule- based data clustering toolkit[C]//Honolulu: Congress on Evolutionary Computation(CEC), 2002.
6Strehl A, Ghosh J. A scalable approach to balanced, high-dimensional clustering of market baskets[C]..Proceedings of the 17th International Conference on High Performance Computing, Bangalore; Springer LNCS, 2000:525-536.
7Banerjee A,Ghosh j. On scaling up balanced clustering algorithrns[CJ//Arlington: Proceedings of the 2nd SIAM ICDM,2002.
8Berkhin P, Becher J. Learning simple relations: theory and applications[C]//Arlington: Proceedings of the 2nd SIAM ICDM, 2002 : 333-349.

同被引文献157

1冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18
2李媛媛,许录平.用于矢量地图版权保护的数字水印[J].西安电子科技大学学报,2004,31(5):719-723. 被引量：32
3陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量：44
4刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
5阳树洪,王江涛.基于小波变换和余弦变换的盲水印技术[J].兰州交通大学学报,2005,24(3):88-90. 被引量：1
6张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
7郑吉平,秦小麟.数据挖掘中采样技术的研究[J].系统工程与电子技术,2005,27(11):1946-1949. 被引量：5
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
9段海滨,王道波,于秀芬.蚁群算法的研究进展评述[J].自然杂志,2006,28(2):102-105. 被引量：31
10朱庆保.蚁群优化算法的收敛性分析[J].控制与决策,2006,21(7):763-766. 被引量：24

引证文献19

1刘丛林,张忠林,曾庆飞.PSO算法在关联规则挖掘中的应用[J].兰州交通大学学报,2010,29(3):96-99. 被引量：4
2傅德胜,周辰.基于密度的改进K均值算法及实现[J].计算机应用,2011,31(2):432-434. 被引量：76
3李小展.基于半监督的K-means聚类改进算法[J].东莞理工学院学报,2011,18(1):29-32. 被引量：1
4傅涛,孙亚民.基于PSO的k-means算法及其在网络入侵检测中的应用[J].计算机科学,2011,38(5):54-55. 被引量：34
5陈建国.一种海量数据挖掘的有效方法[J].软件,2011,32(5):65-66. 被引量：2
6王秀芳,王岩,岳茂兴.天然气管道泄漏检测中的知识发现[J].计算机技术与发展,2012,22(4):137-140. 被引量：6
7陈英,何中市,黄敏.一种优化的K-means聚类中心算法研究[J].制造业自动化,2012,34(8):19-22. 被引量：5
8汪永旗.一种改进的K_means算法在旅游客户细分中的应用[J].宁波大学学报（理工版）,2012,25(3):58-61. 被引量：1
9皮国强,杜朝东.改进的k-均值算法在大学生科技创业活动研究中的应用[J].软件导刊,2012,11(9):38-39.
10郝春梅,吴波.基于量子蚁群改进的K-means算法[J].计算机测量与控制,2013,21(4):1011-1013. 被引量：3

二级引证文献168

1宋军英,崔益伟,李欣然,钟伟,邹鑫,李培强.基于欧氏动态时间弯曲距离与熵权法的负荷曲线聚类方法[J].电力系统自动化,2020(15):87-98. 被引量：32
2陈建国.一种海量数据挖掘的有效方法[J].软件,2011,32(5):65-66. 被引量：2
3苏志刚,韩佩佩,吴仁彪.基于数据挖掘的快速记录存储器数据处理技术[J].信息与电子工程,2012,10(1):118-123. 被引量：2
4岳金柱,王德来.对易县“两山”划分和“四荒”拍卖的思考[J].河北林果研究,2000,15(1):20-23. 被引量：3
5王培崇,钱旭,雷凤君.新的混合小生境鱼群聚类算法[J].计算机应用,2012,32(8):2189-2192. 被引量：7
6于海涛,李梓,姚念民.K-means聚类算法优化方法的研究[J].小型微型计算机系统,2012,33(10):2273-2277. 被引量：22
7皮国强,杜朝东.改进的k-均值算法在大学生科技创业活动研究中的应用[J].软件导刊,2012,11(9):38-39.
8于海涛,王慧强,李梓,韩立娟.基于模拟谐振子的优化K-means聚类算法[J].计算机工程与应用,2012,48(30):122-127. 被引量：4
9黎银环,张剑.改进的K-means算法在入侵检测中的应用[J].计算机技术与发展,2013,23(1):165-168. 被引量：3
10段艳明,肖辉辉.改进Apriori算法处理海量数据的研究[J].电脑与信息技术,2013,21(1):22-24. 被引量：1

1王慧,申石磊.一种改进的特征加权K-means聚类算法[J].微电子学与计算机,2010,27(7):161-163. 被引量：12
2郭德超,胡昌盛.一种K-均值聚类的改进算法[J].科学时代,2013(23).
3黄悦.如何做到质量管理零缺陷[J].天津造纸,2008,30(4):37-39.
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
5张忠林,曹志宇,李元韬.基于加权欧式距离的k_means算法研究[J].郑州大学学报（工学版）,2010,31(1):89-92. 被引量：35
6林江云,雷良桃.聚类算法在证券公司CRM中客户细分的应用[J].心智与计算,2010,0(4):265-270. 被引量：4
7贾世祥,俞建新.基于加权三角面法向变化的模型简化算法[J].系统仿真学报,2005,17(9):2111-2114. 被引量：6
8王卫平,周忠眉,郑艺峰.基于支持度和增比率的改进关联分类算法[J].计算机工程与科学,2016,38(2):370-375. 被引量：4
9陈东晓,陈庆奎.基于密度优化的KNN算法的研究[J].上海理工大学学报,2010,32(5):507-510. 被引量：1
10韦余苹.基于UG和Moldflow的手机壳注塑模具优化设计[J].机械工程师,2014(11):136-138. 被引量：5

兰州交通大学学报

2009年第6期

浏览历史

内容加载中请稍等...

快速查找初始聚类中心的K_means算法被引量：19

参考文献8

同被引文献157

引证文献19

二级引证文献168

相关作者

相关机构

相关主题

浏览历史

快速查找初始聚类中心的K_means算法 被引量：19

参考文献8

同被引文献157

引证文献19

二级引证文献168

相关作者

相关机构

相关主题

浏览历史

快速查找初始聚类中心的K_means算法被引量：19