对k-means初始聚类中心的优化被引量：29

Optimization to k-means initial cluster centers

下载PDF

导出

摘要针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心。理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率。 To solve this problems that the traditional k-means algorithm has sensitivity to the initial cluster centers, an new improved k- means algorithm is proposed. A new method for selecting initial cluster centers based on the actual distribution of data is presented. First it constructes K data sets using greedy thinking, the sizes of sets are related to the real distribution of the entire data. The data belong to the same set are close to each other. Then taking the average of the data sets as the initial cluster centers. The initial cluster centers are found to be very close to the desired cluster centers for iterative clustering algorithms. Theory analysis and experimental results demon- strate that the improved algorithm can enhance the clustering performance, get stable clustering in a higher accuracy.

作者仝雪姣孟凡荣王志晓

机构地区中国矿业大学计算机科学与技术学院

出处《计算机工程与设计》 CSCD 北大核心 2011年第8期2721-2723,2788,共4页 Computer Engineering and Design

基金国家自然科学基金项目(50674086)

关键词聚类 K-MEANS算法数据分布初始聚类中心改进算法 clustering k-means algorithm data distribution initial cluster centers improve algorithm

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献14

1韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：91
2汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
3XU Junling,XU Baowen,ZHANG Weifeng,ZHANG Wei,HOU Jun.Stable Initialization Scheme for K-Means Clustering[J].Wuhan University Journal of Natural Sciences,2009,14(1):24-28. 被引量：15
4赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：74
5王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
6毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26
7钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
8袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
9万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
10Leng Mingwei,Tang Haitao,Chen Xiaoyun.An efficient K-means clustering algorithm based on influence factors[].EighthACIS International Conference on Software EngineeringArtifi-cial IntelligenceNetworkingand Parallel/Distributed Compu-ting.2007

二级参考文献76

1荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
2袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
3李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
4李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
5钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
6袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
7Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND lnt Conf Managemerit on Data, Seattle, Washington, 1998 . 73-84.
8Ester M,Kriegel H P,Sander J.A density-based algorithm tier discovering chlsters in large spatial databases with noise[C]//Proc 2nd Int Conf on Knowledge Discovery and Data Mining.Portland, 1999.20:226-231.
9Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001
10Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668

共引文献471

1赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：3
2段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
3吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
4楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
5柳永念,郭会林.对C均值聚类算法的一些改进[J].广西大学学报（哲学社会科学版）,2007,29(S3):207-208.
6吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
7王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
8陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
9张春英,刘保相,刘凤春.基于SPA的动态聚类统计分析及其应用[J].计算机工程与设计,2006,27(20):3947-3948. 被引量：2
10黄建春,邹汉斌,李晓峰.基于文本聚类的映射聚类算法研究[J].计算机工程与设计,2007,28(6):1264-1266. 被引量：1

同被引文献210

1崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
2WANG XuDong,LIN JiKeng.Island partition of the distribution system with distributed generation[J].Science China(Technological Sciences),2010,53(11):3061-3071. 被引量：21
3陈孝新.熵权法在股票市场的应用[J].商业研究,2004(16):139-140. 被引量：9
4杨世兴.煤矿监测监控系统的现状与发展[J].安防科技（安全经理人）,2004(5):39-41. 被引量：32
5万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
6张明波,陆锋,申排伟,程昌秀.R树家族的演变和发展[J].计算机学报,2005,28(3):289-300. 被引量：94
7李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量：1212
8陈雷,王延章.熵权法对融合网络服务质量效率保障研究[J].计算机工程与应用,2005,41(23):1-3. 被引量：3
9石玉江,张海涛,侯雨庭,时卓.基于岩石物理相分类的测井储层参数精细解释建模[J].测井技术,2005,29(4):328-332. 被引量：33
10袁新涛,彭仕宓,林承焰,贾瑞高.分流动单元精确求取储层渗透率的方法[J].石油学报,2005,26(6):78-81. 被引量：34

引证文献29

1唐波.改进的K-means聚类算法及应用[J].软件,2012,33(3):100-104. 被引量：9
2郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
3王芳妮,贺兴时,谌路,杨敏.改进的K-means算法[J].纺织高校基础科学学报,2012,25(3):370-373. 被引量：1
4张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
5李向,刘素红.一种基于离群指数的初始聚类中心优选算法[J].微电子学与计算机,2013,30(6):109-112.
6李婧.一种改进的最近邻聚类算法[J].重庆工商大学学报（自然科学版）,2013,30(10):61-63. 被引量：1
7田腾浩.优化初始聚类中心的K-Means算法[J].网络安全技术与应用,2014(9):42-43. 被引量：3
8宋天勇,赵辉,李万龙,王璐,田世元.引入自检策略的进化K-means算法[J].东北师大学报（自然科学版）,2014,46(3):59-63. 被引量：1
9党小超,毛鹏鑫,郝占军.基于快速求解高斯混合模型的流量聚类算法[J].计算机工程与应用,2015,51(8):96-101. 被引量：6
10宋旭东,朱文辉,邱占芝.大数据k-Means聚类挖掘优化算法[J].大连交通大学学报,2015,36(3):91-94. 被引量：6

二级引证文献323

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145.
2杨捷,李沛霖,罗成臣,洪锋.基于数据挖掘的电网用户行为分析[J].云南大学学报（自然科学版）,2020,42(S02):38-43. 被引量：20
3陈世楼,洪松琛,孙鹏.基于历史数据分析的采购策略智能推荐模型研究[J].企业改革与管理,2021(9):7-8. 被引量：3
4SHI Xinlei,CUI Yunjiang,XU Wankun,ZHANG Jiansheng,GUAN Yeqin.Formation permeability evaluation and productivity prediction based on mobility from pressure measurement while drilling[J].Petroleum Exploration and Development,2020,47(1):146-153.
5冯霞,曾晓维,卢敏.基于层次出行意图的旅客航线偏好预测[J].计算机应用研究,2020,37(S02):126-128.
6张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：18
7张俊潇,高崇,劳永钊,段瑶,程苒.基于混沌二进制麻雀搜索的配电网故障恢复方法[J].高电压技术,2023,49(S01):247-253.
8何柱裕,王丽.迟发性运动障碍的药物治疗[J].中国药师,2000,3(2):111-111. 被引量：1
9黄泽豪,张学锋.改进后的k-means算法在电子商务中的应用[J].福建电脑,2013,29(7):112-114.
10郭伟,王西闯,肖振久.基于K均值和双支持向量机的P2P流量识别方法[J].计算机应用,2013,33(10):2734-2738. 被引量：4

1张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：61
2马骏,尉广军.一种改进的RBF神经网络学习算法[J].计算机系统应用,2013,22(2):84-87. 被引量：5
3张继昊,张爱新,陆松年,高奎,金波.基于自组织映射网络的图像分割算法[J].信息安全与通信保密,2010,7(4):50-52. 被引量：1
4郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
5陈东宁,崔晓峰.基于单元格空间的K-Means初始聚类中心选择算法[J].数字技术与应用,2011,29(10):118-119. 被引量：2
6曹付元,梁吉业,姜广.基于邻域模型的K-means初始聚类中心选择算法[J].计算机科学,2008,35(11):181-184. 被引量：6
7毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26
8贾瑞玉,宋建林.基于聚类中心优化的k-means最佳聚类数确定方法[J].微电子学与计算机,2016,33(5):62-66. 被引量：27
9毛韶阳,李肯立.K-means初始聚类中心优化算法研究[J].重庆邮电大学学报（自然科学版）,2007,19(4):422-425. 被引量：6
10陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29

计算机工程与设计

2011年第8期

浏览历史

内容加载中请稍等...

对k-means初始聚类中心的优化被引量：29

参考文献14

二级参考文献76

共引文献471

同被引文献210

引证文献29

二级引证文献323

相关作者

相关机构

相关主题

浏览历史

对k-means初始聚类中心的优化 被引量：29

参考文献14

二级参考文献76

共引文献471

同被引文献210

引证文献29

二级引证文献323

相关作者

相关机构

相关主题

浏览历史

对k-means初始聚类中心的优化被引量：29