优化初始聚类中心及确定K值的K-means算法被引量：26

A K-means Algorithm Based on Optimizing the Initial Clustering Center and Determining the K Value

下载PDF

导出

摘要 K-means聚类算法中,我们需要输入两个参数,一个是聚类数K,另一个是初始聚类中心,初始聚类中心的选择对聚类结果有较大的影响,传统的K-means聚类算法随机挑选K个聚类中心,而随机挑选的聚类中心难免会取到孤立点,这将对聚类结果产生很大的影响。K值是用户输入,K值选取的不好也将影响聚类效果。论文提出了一种改进的K-means聚类算法,先根据类簇指标确定需要聚类的数K,之后采用基于密度的思想,首先将聚类样本分为核心点、边界点和孤立点,之后排除孤立点和边界点并取核心点的中心点作为K个聚类中心后再进行K-means聚类,实验表明改进后的算法比原始的K-means聚类算法准确性更高。 Two parameters in the K-means algorithm need to be input,the one is the number of the K which is needed to clustering and the other is the initial clustering center. Selecting the initial cluster centers has a large impact on the clustering results in the algorithm of the K-means,the traditional K-means clustering algorithm selects the clustering center randomly,while randomlyselect the cluster center will inevitably take the outlier point,this has a large impact on the clustering results. The number of K is in-puted by users,a bad K also has a large impact on the on the clustering results. This paper proposes an improved K-means cluster-ing algorithm that based on the density of the thought,firstly divides the clustering samples into core point,border point and outlierpoint,then delete the border point and outlier point from the clustering samples and select the clustering center by using the center of clustering samples,the test shows that the improved algorithm has more stability than before.

作者蒋丽薛善良

机构地区南京航空航天大学计算机科学与技术学院

出处《计算机与数字工程》 2018年第1期21-24,113,共5页 Computer & Digital Engineering

关键词 K-MEANS聚类聚类数聚类中心密度孤立点 K-means clustering clustering number clustering center density outlier point

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1韩凌波.基于密度的K-means初始聚类中心选取算法[J].电子科技,2015,28(7):105-107. 被引量：8
2杨金花,刘显为.K-means聚类算法初始中心选择研究[J].河南科学,2016,34(3):348-351. 被引量：7

二级参考文献23

1张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
2逄玉俊,柳明,李元.k均值聚类分析在过程改进中的应用[J].华中科技大学学报（自然科学版）,2009,37(S1):245-247. 被引量：9
3李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
5Han Jiawei, Micheline Kamber. Data mining: concepts andtechniques [ M] . San Francisco: Morgan Kaufmann Publish-ers,2001.
6Tan Pangning,Michael Steinbach,Vipin Kumar. Introductionto data mining [ M]. Newyork:Addison Wesley,2005.
7赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
8汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：140
9谭庆.基于k-means聚类算法的试卷成绩分析研究[J].河南大学学报（自然科学版）,2009,39(4):412-415. 被引量：20
10孙可,刘杰,王学颖.K均值聚类算法初始质心选择的改进[J].沈阳师范大学学报（自然科学版）,2009,27(4):448-450. 被引量：15

共引文献11

1尹晓丽.重心随机漂移KMeans聚类算法的设计[J].长春大学学报,2017,27(8):35-38. 被引量：2
2完颜勇,王宗贤.基于关键点检测的文档文本定位算法研究[J].电子科技,2017,30(12):62-66.
3刘婷.基于粒子群和K-均值聚类算法的学生心理分析方法研究[J].电子设计工程,2018,26(19):75-79. 被引量：8
4先梦瑜.基于TCSDG的民航旅客行为偏好模型的建立与仿真[J].电子设计工程,2018,26(21):62-66. 被引量：2
5任恒怡,贺松,陈文亮.一种改进的K-means聚类算法在图像分割中的应用[J].通信技术,2017,50(12):2704-2707. 被引量：9
6杨莉云,颜远海.基于孤立点自适应的K-means算法[J].河南科学,2019,37(4):507-513. 被引量：4
7杨文君.k＿m eans算法初始聚类中心点选取方法研究[J].科学技术创新,2019(33):84-85. 被引量：1
8任楚岚,乔天宇,张阳.基于改进K-means聚类算法聚类点选取办法的研究[J].网络安全技术与应用,2020(6):49-50. 被引量：3
9曹莉敏,周从华.一种面向SNP选择的K-Center算法[J].计算机应用与软件,2020,37(9):227-234.
10曾如明,李云飞.K-means聚类算法的一种改进方法研究[J].邵阳学院学报（自然科学版）,2021,18(2):8-14. 被引量：7

同被引文献246

1刘伯海.沈海线福泉高速公路ETC门架系统[J].中国交通信息化,2019,0(10):91-93. 被引量：5
2陆声链,林士敏.基于距离的孤立点检测研究[J].计算机工程与应用,2004,40(33):73-75. 被引量：44
3曹树金,罗春荣,马利霞.论图书馆个性化服务的几个基本问题[J].大学图书馆学报,2005,23(6):33-39. 被引量：152
4耿技,印鉴.改进的共享型最近邻居聚类算法[J].电子科技大学学报,2006,35(1):70-72. 被引量：5
5郭应时,付锐,袁伟,张建峰.通道宽度对驾驶员动态视觉和操作行为的影响[J].中国公路学报,2006,19(5):83-87. 被引量：49
6杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
7吕秋霞,张景鸿.基于神经网络的水果自动分类系统设计[J].安徽农业科学,2009,37(35):17392-17394. 被引量：17
8谢娟英,蒋帅,王春霞,张琰,谢维信.一种改进的全局K-均值聚类算法[J].陕西师范大学学报（自然科学版）,2010,38(2):18-22. 被引量：47
9韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：93
10胡彩平,秦小麟.一种基于密度的局部离群点检测算法DLOF[J].计算机研究与发展,2010,47(12):2110-2116. 被引量：52

引证文献26

1李艳娟,牛梦婷,李林辉.基于蜂群k-means算法的遥感图像聚类应用研究[J].计算机工程与应用,2019,55(6):151-159. 被引量：20
2王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：109
3黄强,叶青,聂斌,李欢.离群点识别方法研究[J].软件导刊,2019,18(6):35-41. 被引量：2
4王海燕,崔文超,许佩迪,李闯.一种局部概率引导的优化K-means++算法[J].吉林大学学报（理学版）,2019,57(6):1431-1436. 被引量：7
5包志强,赵媛媛,胡啸天,赵研.一种对孤立点不敏感的新的K-Means聚类算法[J].现代电子技术,2020,43(5):109-112. 被引量：5
6王家伟,王志明,张合.基于视频处理的畜禽屠宰线工位监测研究[J].中国农机化学报,2020,41(2):86-91.
7黄松,邱建林.改进的遗传k-means算法及其应用[J].计算机工程与设计,2020,41(6):1617-1623. 被引量：21
8张海华,李楠楠.基于大数据K-means聚类算法的在线学习行为路径的研究[J].电子设计工程,2020,28(12):17-20. 被引量：13
9谢永辉,杨东海.面向钢铁工业场景的三维点云技术研究[J].现代信息科技,2020,4(7):142-144. 被引量：4
10孙卫忠,张楠,李亚函,高迎平.基于改进K-Means算法的图书馆读者阅读需求实证研究[J].新世纪图书馆,2020(5):59-64.

二级引证文献261

1吴安迪,蒋文明.基于数据挖掘的《景岳全书·血证》用药规律分析[J].中药药理与临床,2022,38(1):201-206. 被引量：2
2冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
3李雅薇,孟娟,杜海,朱珈缘,马媛媛.一种基于YOLOv5改进的动捕Maker点识别方法[J].计算机与数字工程,2023,51(1):112-118.
4刘辉.遥感手段全要素地表分类在国情普查中的应用[J].江西测绘,2021(3):44-47.
5肖韵菲,黄捷,孙冠宇,高希龙,陈建国,文婷婷,文剑.基于无监督机器学习的核电厂支吊架智能布置研究[J].电子技术（上海）,2021,50(1):58-61. 被引量：2
6王佳欣,窦小磊.基于Harris角点的快速帧移动多视点图像跟踪识别[J].智能计算机与应用,2021,11(3):22-25. 被引量：2
7高蕾,李安娜.变电运维中的危险点及其预控对策[J].光源与照明,2023(5):210-212. 被引量：4
8陆靖滨.智能电网变电运行研究[J].光源与照明,2023(5):207-209. 被引量：3
9徐送宁,孙树滋.N^+注入Ag薄膜晶体生长机制的研究[J].沈阳工业学院学报,2000,19(1):8-11.
10张劲松,季平.四种颈淋巴清扫术切口在口腔外科中的比较[J].重庆医科大学学报,2000,25(2):208-209. 被引量：2

1刘闯,陈桂芬.基于密度最大值的K-means初始聚类中心点算法改进[J].数字技术与应用,2017,35(11):118-119. 被引量：4
2杨莉,沈鑫,李英娜,李萌萌.基于电力数据聚类分析的算法改进[J].云南电力技术,2017,45(6):64-68. 被引量：3
3刘蓉晖,赵才涛.基于数据挖掘技术的气温敏感负荷短期预测研究[J].电网与清洁能源,2017,33(11):32-38. 被引量：11
4万静,张超,何云斌,李松.可变网格优化的K-means聚类方法[J].小型微型计算机系统,2018,39(1):95-99. 被引量：10
5刘哲,韩九强,黄世奇.基于多引导滤波器的单幅图像超分辨率技术[J].红外技术,2017,39(10):920-927. 被引量：1
6涂继辉,眭海刚,吕枘蓬,贾曲,孙开敏.基于基尼系数的倾斜航空影像中建筑物立面损毁检测[J].武汉大学学报（信息科学版）,2017,42(12):1744-1748. 被引量：4
7谭彩娟,赖承栋,苗晴.基于改进的K-means算法研究家庭环境对中学生认知能力的影响[J].电脑知识与技术,2017,13(11X):178-180. 被引量：1
8苏适,李红萍,严玉廷,陆海,王飞,任惠,N.A.Engerer,米增强.服务于区域光伏预测的天空图像K-means云空辨识模型[J].华北电力大学学报（自然科学版）,2017,44(6):61-68.
9张松兰,田丽.基于相似性和距离及遗传模拟退火的自适应聚类算法[J].火力与指挥控制,2018,43(1):103-106. 被引量：4
10胡晓雪.考虑类结构变动的自适应进化聚类及其在客户细分中的应用[J].数据分析与知识发现,2017,1(12):21-31. 被引量：1

计算机与数字工程

2018年第1期

浏览历史

内容加载中请稍等...

优化初始聚类中心及确定K值的K-means算法被引量：26

参考文献2

二级参考文献23

共引文献11

同被引文献246

引证文献26

二级引证文献261

相关作者

相关机构

相关主题

浏览历史

优化初始聚类中心及确定K值的K-means算法 被引量：26

参考文献2

二级参考文献23

共引文献11

同被引文献246

引证文献26

二级引证文献261

相关作者

相关机构

相关主题

浏览历史

优化初始聚类中心及确定K值的K-means算法被引量：26