基于密度的K-means聚类中心选取的优化算法被引量：48

Optimization algorithm of K-means clustering center of selection based on density

下载PDF

导出

摘要针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。 Aiming at the problem of traditional K-means algorithm which is sensitive to initial clustering center and the number of cluster,this paper proposed a kind of optimization algorithm of initial clustering center selection.The algorithm was accor-ding to the distribution density of data and calculated the two vertical halfway points recently to determine the initial clustering center,then combined the equalization function to optimize the cluster number and got the optimal cluster.Used the standard UCI data sets as the contrast experiment objects,and found that the improved algorithm has the high accuracy and relative stability compared with traditional algorithm.

作者周炜奔石跃祥

机构地区湘潭大学信息工程学院计算机科学与工程系

出处《计算机应用研究》 CSCD 北大核心 2012年第5期1726-1728,共3页 Application Research of Computers

基金湖南省教育厅创新平台开放基金资助项目(11K069) 湖南省自然科学基金资助项目(07JJ6115) 智能制造湖南省高校重点实验室资助项目(2009IM06)

关键词 K-均值数据挖掘聚类中心垂直中点密度 K-means data mining clustering center vertical halfway point density

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1060
2KAUFMAN L,ROUSSEEUW P J.Finding groups in data:an intro-duction to cluster analysis[M].New York:Wiley,1990.
3ESTER M,KRIEGEL H P,SANDER J,et al.A density based algo-rithm for disco-vering clusters in large spatial databases with no ise[C]//Proc of the 2nd International Conference on Knowledge Disco-very and Data Mining.Portland:AAAI Press,1996:226-231.
4GUHA S,RASTOGI R,SHIM K.CURE:an efficient clustering al-gorithm for large databases[C]//Proc of the ACM SIGMOD Interna-tional Conference on Management of Data.New York:ACM Press,1998:73-84.
5王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
6马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108
7袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
8汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
9杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：187
10姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14

二级参考文献58

1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：187
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
3李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
4冯征.一种基于粗糙集的K-Means聚类算法[J].计算机工程与应用,2006,42(20):141-142. 被引量：16
5钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
6Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001
7Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668
8Dhillon I S, Guan Yuqiang, Kogan J. Refining Clusters in High Dimensional Text Data//Proc of the 2nd SIAM Workshop on Clustering High Dimensional Data. Arlington, USA, 2002 : 59 - 66
9Zhang B. Generalized K-Harmonic Means: Dynamic Weighting of Data in Unsupervised Learning//Proc of the 1 st SIAM International Conference on Data Mining. Chicago, USA, 2001 : 1 - 13
10Sarafis I, Zalzala A M S, Trinder P W. A Genetic Rule-Based Data Clustering Toolkit//Proc of the Congress on Evolutionary Computation. Honolulu, USA, 2002 : 1238 - 1243

共引文献1634

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：3
3王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
4林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
10段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1

同被引文献372

1唐亚松,张鑫,蔡焕杰,王健.一种基于回归分析与时序分析的降水预报模型[J].水土保持通报,2009,29(1):88-91. 被引量：8
2陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
3江景涛,王延耀,杨然兵,梅树立.基于分裂Bregman算法的玉米种子品种识别(英文)[J].农业工程学报,2012,28(S2):248-252. 被引量：10
4陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
5邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：146
6袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
7张海燕,丁峰,姜丽红.基于模糊聚类的协同过滤推荐方法[J].计算机仿真,2005,22(8):144-147. 被引量：25
8施华,李翠华,韦凤梅,王华伟.基于像素可信度和空间位置的运动目标跟踪[J].计算机研究与发展,2005,42(10):1726-1732. 被引量：13
9曹树金,罗春荣,马利霞.论图书馆个性化服务的几个基本问题[J].大学图书馆学报,2005,23(6):33-39. 被引量：152
10高丹,迟道才,王铁良.基于MATLAB神经网络的水稻需水量的预报模型[J].沈阳农业大学学报,2005,36(5):599-602. 被引量：20

引证文献48

1索飞,张洪伟,邹书蓉.多目标监督聚类GA研究[J].成都大学学报（自然科学版）,2013,32(1):58-60.
2叶安新,邓大勇.基于改进量子遗传算法的聚类算法[J].计算机仿真,2013,30(4):275-278. 被引量：5
3龚炳江,唐宇敬.Android平台下煤矿瓦斯监控系统客户端研究[J].煤矿安全,2013,44(4):122-124. 被引量：6
4王雪光,陈淑红.基于K均值聚类的成熟草莓图像分割算法[J].农机化研究,2013,35(6):51-54. 被引量：24
5王娟,杨瑞峰,郭晨霞.基于K-means聚类的光纤环边缘提取算法[J].传感器世界,2013,19(12):23-25.
6程洪,史智兴,冯娟,李亚南,尹辉娟.基于玉米胚部特征参数优化的玉米品种识别研究[J].中国粮油学报,2014,29(6):22-26. 被引量：5
7邢长征,谷浩.基于平均密度优化初始聚类中心的k-means算法[J].计算机工程与应用,2014,50(20):135-138. 被引量：32
8宋玲,戚云枫,齐东阳.分布式k-means聚类算法的改进[J].广西大学学报（自然科学版）,2014,39(5):1060-1065. 被引量：3
9陈亚峰.一种新的K-均值动态聚类算法[J].济源职业技术学院学报,2014,13(4):4-7.
10段桂芹.基于均值与最大距离乘积的初始聚类中心优化K-means算法[J].计算机与数字工程,2015,43(3):379-382. 被引量：17

二级引证文献320

1周晓,朱晗雨.基于Hadoop的高压输电线路合闸故障诊断方法[J].数字制造科学,2022(2):104-110. 被引量：1
2桂力,徐顺,王华东,许宁,梁晓冬.基于视频监控的船舶跟踪与自动统计方法研究[J].中国水运（下半月）,2023(2):18-21.
3董环,娄春荣,张青,韩瑛祚,王辉.调节草炭pH值对其有效养分和番茄、辣椒幼苗生长的影响[J].中国农学通报,2020,0(7):55-62. 被引量：4
4段桂芹,邹臣嵩.基于K-medoids算法的学生成绩聚类研究[J].微型电脑应用,2020,0(2):64-66. 被引量：1
5孙伟鹏,吴锡生,孟斌.基于Spark并行的密度峰值聚类算法[J].计算机应用研究,2020,37(1):163-166. 被引量：2
6张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：18
7夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：14
8段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
9岳希,梁云浩,何磊.基于改进YOLO算法的船舰目标检测DT-YOLO方法研究[J].成都信息工程大学学报,2022,37(5):533-537.
10顾利红,朱品业.薄层扫描法测定穿心莲中穿心莲内酯、脱水穿心莲内酯的含量[J].中草药,2000,31(4):260-262. 被引量：29

1钱雪忠,施培蓓,张明阳,汪中.基于均衡化函数的k均值优化算法[J].计算机工程,2008,34(14):60-62. 被引量：7
2苗京,黄红星,程卫生,袁启勋.基于蚁群模糊聚类算法的图像边缘检测[J].武汉大学学报（工学版）,2005,38(5):124-127. 被引量：19
3胡恒滔,龙建忠.基于蚁群算法的模糊C-均值聚类算法在声纹识别中的应用[J].四川大学学报（自然科学版）,2007,44(3):543-547. 被引量：10
4曾利军,李泽军,柳佳刚.基于矩阵加权关联规则的区间模糊C均值聚类[J].计算机工程,2010,36(22):52-54. 被引量：1
5王森,赵发勇,陈曙光.基于用户领域知识优化ID3算法的研究与应用[J].阜阳师范学院学报（自然科学版）,2016,33(2):65-69.
6汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
7徐枫,刘爱东,陈宏利.一种水下对空成像图像增强算法[J].光学与光电技术,2007,5(3):59-61. 被引量：4
8施培蓓,钱雪忠,汪中.基于均衡化函数的快速K-means算法[J].计算机工程与应用,2008,44(3):189-191. 被引量：1
9杨国亮,王志良,任金霞,李钟侠.一种基于遗传操作的聚类算法[J].计算机应用,2003,23(z2):199-201.
10吴陈,许友权.点密度优选中心最大熵核FCM文本聚类算法[J].计算机工程与设计,2016,37(9):2411-2415. 被引量：3

计算机应用研究

2012年第5期

浏览历史

内容加载中请稍等...

基于密度的K-means聚类中心选取的优化算法被引量：48

参考文献11

二级参考文献58

共引文献1634

同被引文献372

引证文献48

二级引证文献320

相关作者

相关机构

相关主题

浏览历史

基于密度的K-means聚类中心选取的优化算法 被引量：48

参考文献11

二级参考文献58

共引文献1634

同被引文献372

引证文献48

二级引证文献320

相关作者

相关机构

相关主题

浏览历史

基于密度的K-means聚类中心选取的优化算法被引量：48