K-means初始聚类中心的选择算法被引量：35

Selection algorithm for K-means initial clustering center

下载PDF

导出

摘要 K-means算法随机选取初始聚类中心,容易造成聚类准确率低且聚类结果不稳定。针对这一问题,提出一种初始聚类中心的选择算法。通过k-dist的差值(DK)图分析,确定数据点在k-dist图上的位置,选择主要密度水平曲线上k-dist值最小的点作为初始聚类中心。实验证明,改进算法选择的初始聚类中心唯一,聚类结果稳定,聚类准确率高,迭代次数少。 The initial clustering centers of K-means algorithm are randomly selected, which may result in low accuracy and unstable clustering. To solve these problems, a K-means initial clustering center selection algorithm was proposed. The locations of data points were determined by analyzing Difference of K-dist （DK） graph. One point with the least k-dist value on the main density curves was selected as an initial clustering center. The experimental results demonstrate that the improved algorithm can select unique initial clustering center, gain stable clustering result, get higher accuracy and reduce times of iteration.

作者郑丹王潜平

机构地区江苏师范大学人事处中国矿业大学计算机科学与技术学院

出处《计算机应用》 CSCD 北大核心 2012年第8期2186-2188,2192,共4页 journal of Computer Applications

基金国家科技支撑计划项目(2008BAH37B05095)

关键词聚类 K-MEANS算法 k-dist图 k-dist的差值图密度 clustering K-means algorithm k-dist graph Difference of K-dist （DK） graph density

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献15

1Han J W Kamber M 范明孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版杜,2001.147-158.
2吴夙慧,成颖,郑彦宁,潘云涛.K-means算法研究综述[J].现代图书情报技术,2011(5):28-35. 被引量：160
3刘一鸣,张化祥.可变阈值的K-Means初始中心选择方法[J].计算机工程与应用,2011,47(32):56-58. 被引量：8
4熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：86
5仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
6姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14
7周海岩,白晓林.基于图的K-均值聚类法中初始聚类中心选择[J].计算机测量与控制,2010,18(9):2167-2169. 被引量：11
8黄敏,何中市,邢欣来,陈英.一种新的k-means聚类中心选取算法[J].计算机工程与应用,2011,47(35):132-134. 被引量：20
9王赛芳,戴芳,王万斌,张晓宇.基于初始聚类中心优化的K-均值算法[J].计算机工程与科学,2010,32(10):105-107. 被引量：24
10汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139

二级参考文献175

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
3周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
4袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
5万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16
6张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
7王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：187
9李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
10李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39

共引文献664

1左晓飞,刘怀亮,范云杰,赵辉.基于概念语义场的文本聚类算法研究[J].情报杂志,2012,31(5):180-184. 被引量：2
2王生昌,李良敏,杨立本,邱兆文.营运车辆驾驶人适宜性甄别检测评价系统研究[J].交通信息与安全,2013,31(1):65-69. 被引量：2
3高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
4王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
5陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
6叶震,周兵斌.基于数据挖掘的NIDS日志分析系统[J].合肥工业大学学报（自然科学版）,2005,28(1):87-90.
7于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报（自然科学版）,2005,32(5):57-61. 被引量：27
8陈亚东.数据挖掘在图书馆中的应用[J].中华医学图书情报杂志,2006,15(5):16-18. 被引量：3
9郭俊芳,谢益武,周生宝.关联规则相关性的度量[J].计算机应用,2007,27(4):892-893. 被引量：6
10徐雪松,章兢,贺庆.一种基于免疫聚类竞争的关联规则挖掘算法[J].计算机工程与应用,2007,43(16):16-19. 被引量：1

同被引文献272

1李士敏,李强,孙崇鲁,彭昕.基于多模式识别结合指纹图谱的三叶青产地鉴别比较研究[J].中草药,2020,51(1):197-203. 被引量：17
2陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
3陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
4褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542. 被引量：557
5李桂林,陈晓云.关于聚类分析中相似度的讨论[J].计算机工程与应用,2004,40(31):64-65. 被引量：26
6肖春景,张敏.基于减法聚类与模糊c-均值的模糊聚类的研究[J].计算机工程,2005,31(B07):135-137. 被引量：22
7张志政,邢汉承.一种基于实例推理的概念学习方法[J].计算机工程与应用,2006,42(10):87-90. 被引量：2
8苏冬雪,吴小俊.基于多特征模糊聚类的图像融合方法[J].计算机辅助设计与图形学学报,2006,18(6):838-843. 被引量：12
9FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：29
10李杰,贾瑞玉,张璐璐.一个改进的基于DBSCAN的空间聚类算法研究[J].计算机技术与发展,2007,17(1):114-116. 被引量：13

引证文献35

1杨捷,李沛霖,罗成臣,洪锋.基于数据挖掘的电网用户行为分析[J].云南大学学报（自然科学版）,2020,42(S02):38-43. 被引量：20
2郭伟,王西闯,肖振久.基于K均值和双支持向量机的P2P流量识别方法[J].计算机应用,2013,33(10):2734-2738. 被引量：4
3张宝华,刘鹤,侯贺.基于多聚类中心和PCNN的医学图像融合算法[J].激光与红外,2014,44(4):452-456. 被引量：1
4田腾浩.优化初始聚类中心的K-Means算法[J].网络安全技术与应用,2014(9):42-43. 被引量：3
5袁汉宁,周彤,韩言妮,陈媛媛.基于MI聚类的协同推荐算法[J].武汉大学学报（信息科学版）,2015,40(2):253-257. 被引量：11
6李今.大数据分析在城市照明管理系统中的应用[J].软件导刊,2015,14(5):1-4. 被引量：3
7江京亚,郭庆胜,陈旺,周贺杰,陈勇.一种K-均值聚类的改进算法及其应用[J].测绘工程,2015,24(5):42-46. 被引量：3
8卜旭松,刘立波,石磊.基于PAM和簇阈值的改进K-Means聚类算法[J].湖北工程学院学报,2015,35(3):36-39. 被引量：2
9赵京胜,韩凌霄,孙宇航.一种优化初始中心的改进K-means算法[J].青岛理工大学学报,2015,36(6):99-102. 被引量：2
10何云斌,刘雪娇,王知强,万静,李松.基于全局中心的高密度不唯一的K-means算法研究[J].计算机工程与应用,2016,52(1):48-54. 被引量：10

二级引证文献293

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145.
2杨捷,李沛霖,罗成臣,洪锋.基于数据挖掘的电网用户行为分析[J].云南大学学报（自然科学版）,2020,42(S02):38-43. 被引量：20
3王蕊,王琴,韩晓坤,王露婉,何华阳.基于数据挖掘的公路交通逆反射量值计量技术[J].长安大学学报（自然科学版）,2023,43(3):76-84.
4张明宇,齐瑞锋,王强,刘峰.喷杆机械臂障碍物检测系统设计与性能测试[J].中国农业信息,2021,33(2):49-56. 被引量：2
5杨婧,辛明勇,付卿卿.基于数据挖掘判别用电类别异常的分析与研究[J].科技通报,2023,39(1):49-52. 被引量：1
6卢洪.基于深度学习聚类算法的城市数据分类分级方法[J].工业技术创新,2021,8(4):73-78. 被引量：3
7王鸿玺,李飞,林志文,罗义钊,梁海涛,胡建新.基于IK-means的用电行为研究[J].国外电子测量技术,2020,39(1):54-58. 被引量：5
8何柱裕,王丽.迟发性运动障碍的药物治疗[J].中国药师,2000,3(2):111-111. 被引量：1
9余苏毅.从电子邮件记录文件侦测异常使用行为[J].西安文理学院学报（自然科学版）,2018,21(6):60-63.
10毕孝儒,侯爱莲.改进的图半监督支持向量机用于P2P网络流识别[J].计算技术与自动化,2015,34(1):116-120. 被引量：1

1崔巍,王长松,巩宪锋.使用Nios II实现的CGI嵌入式网络人机交互接口[J].机械工程与自动化,2008(4):26-28.
2仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
3Apache漏洞扫描器中文版[J].黑客防线,2005(1).
4边凯.解读D-D-T[J].中国计算机用户,2004(41).
5张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：61
6梁敏,郭新涛,阮备军,朱扬勇.X_Dist——一个柔性语义距离函数[J].计算机研究与发展,2004,41(10):1728-1736. 被引量：2
7马骏,尉广军.一种改进的RBF神经网络学习算法[J].计算机系统应用,2013,22(2):84-87. 被引量：5
8雷景生,郝阳阳,郝伟.无线传感器网络的定位改进算法[J].上海电力学院学报,2015,31(1):73-76. 被引量：1
9张继昊,张爱新,陆松年,高奎,金波.基于自组织映射网络的图像分割算法[J].信息安全与通信保密,2010,7(4):50-52. 被引量：1
10陈东宁,崔晓峰.基于单元格空间的K-Means初始聚类中心选择算法[J].数字技术与应用,2011,29(10):118-119. 被引量：2

计算机应用

2012年第8期

浏览历史

内容加载中请稍等...

K-means初始聚类中心的选择算法被引量：35

参考文献15

二级参考文献175

共引文献664

同被引文献272

引证文献35

二级引证文献293

相关作者

相关机构

相关主题

浏览历史

K-means初始聚类中心的选择算法 被引量：35

参考文献15

二级参考文献175

共引文献664

同被引文献272

引证文献35

二级引证文献293

相关作者

相关机构

相关主题

浏览历史

K-means初始聚类中心的选择算法被引量：35