一种改进的K-Means算法被引量：6

An Improved K-Means Algorithm

下载PDF

导出

摘要 K-Means算法是一种经典的无监督聚类分析算法,具有运行速度快易于实现等优点,但使用该算法时需要指定聚类数目,且质心的选择具有不确定性。针对上述不足,提出一种基于最大最小距离和BWP指标相结合的K-Means算法。通过对UCI数据库中的4个数据集仿真实验的结果表明,所提出的改进算法在算法的准确率、聚类效果两方面均优于传统的K-Means算法以及基于最大最小距离的K-Means算法。 K-Means algorithm is a classical unsupervised clustering analysis algorithm.Although it has the advantages of fast running speed and easy implementation,it is necessary to specify the number of clustering when using this algorithm,and the selection of centroids is uncertain.In order to verify the performance of the improved algorithm,four data sets in UCI database are simulated and the test results show that,in order to verify the performance of the improved algorithm,a K-Means algorithm based on the combination of maximum and minimum distance and BWP index is proposed in this paper.The improved algorithm proposed in this paper is superior to the traditional K-Means algorithm and the K-Means algorithm based on maximum and minimum distance in terms of accuracy and clustering effect.

作者韩存鸽刘长勇 HAN Cunge;LIU Changyong(College of Mathematics and Computer Science,Wuyi University,Wuyishan,Fujian 354300,China;Fujian Provincial Key Laboratory of Cognitive Computing and Intelligent Information Processing,Wuyishan,Fujian 354300,China)

机构地区武夷学院数学与计算机学院认知计算与智能信息处理福建省高校重点实验室

出处《闽江学院学报》 2019年第5期49-54,90,共7页 Journal of Minjiang University

基金福建省科技厅自然科学基金项目(2017J01651)

关键词 K-MEANS 聚类分析最大最小距离 BWP UCI K-Means cluster analysis maximum and minimum distance BWP UCI

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1万静,张超,何云斌,李松.可变网格优化的K-means聚类方法[J].小型微型计算机系统,2018,39(1):95-99. 被引量：10
2杨慧婷,杨文忠,殷亚博,许超英.基于深度信念网络的K-means聚类算法研究[J].现代电子技术,2019,42(8):145-150. 被引量：13
3谢娟英,马箐,谢维信.一种确定最佳聚类数的新算法[J].陕西师范大学学报（自然科学版）,2012,40(1):13-18. 被引量：11
4贾凡,严妍,张家琪.基于K-means聚类特征消减的网络异常检测[J].清华大学学报（自然科学版）,2018,58(2):137-142. 被引量：21
5郁启麟.K-means算法初始聚类中心选择的优化[J].计算机系统应用,2017,26(5):170-174. 被引量：25
6刘燕.基于抽样和最大最小距离法的并行K-means聚类算法[J].智能计算机与应用,2018,8(6):37-39. 被引量：10
7王琳璘,谢忠局,陈永权,王琦.机器学习聚类组合算法及其应用[J].山东农业大学学报（自然科学版）,2018,49(3):463-466. 被引量：9

二级参考文献52

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：188
3周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：71
4MacQueen J. Some methods for classification and analy- sis of multivariate observations[C]//Lucien M. Le Cam and Jerzy Neyman. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1 .. Statistics. Berkeley: University of California Press, 1967:281-297.
5Gao Xinbo, Li Jie,Tao Dacheng, et al. Fuzziness meas urement of fuzzy sets and its application in cluster validi ty analysis[J]. International Journal of Fuzzy System 2007, 9(4) :188-197.
6Dudoit S, Fridlyand J. A prediction-based resampling method for estimating the number of clusters in a dataset [J]. Genome Biology, 2002, 3(7): 1-21.
7Rousseeuw P J. Silhouettes.. A graphical aid to the interpre- tation and validation of cluster analysis[J].Computational and Applied Mathematics, 1987, 20: 53-65.
8Kapp A V, Tibshirani R. Are clusters found in one dataset present in another dataset? [J].Biostatistics, 2007, 8(1): 9-31.
9Lin T Y. Granular eomputing: from rough sets and neighborhood systems to information granulation and computing with words[C]//European Congress on In- telligent Techniques and Soft Computing, 1997: 1602-1606.
10Yao Y Y. Granular computing., basic issues and possi- ble solutions[C]//Wang P P. Proceedings of the 5th Joint Conference on Information Sciences, Volume I. Atlantic: Association for Intelligent Machinery, 2000: 186-189.

共引文献92

1张超群,韦川源,梁刚,黑小龙,朱旭东.基于深度学习技术的恶意攻击的分析与识别[J].计算机应用研究,2020,37(S01):283-286. 被引量：6
2谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：32
3谢娟英,郭文娟,谢维信,高新波.基于密度RPCL的K-means算法[J].西北大学学报（自然科学版）,2012,42(4):570-576. 被引量：5
4谢娟英,高瑞.Num-近邻方差优化的K-medoids聚类算法[J].计算机应用研究,2015,32(1):30-34. 被引量：11
5袁周米琪,周坚华.自适应确定K-means算法的聚类数：以遥感图像聚类为例[J].华东师范大学学报（自然科学版）,2014(6):73-80. 被引量：3
6卞彩峰,邱建林,陈燕云,陆鹏程,陈璐璐.基于粒计算的k值选取及其应用[J].计算机工程与设计,2015,36(11):3082-3086. 被引量：4
7谢娟英,周颖.一种新聚类评价指标[J].陕西师范大学学报（自然科学版）,2015,43(6):1-8. 被引量：13
8孙宏,景崇毅,黄赶祥,王晓东.基于机型等级的航线市场细分方法研究[J].中国民航飞行学院学报,2016,27(1):13-16.
9杨续昌,陈友玲,兰桂花,阳玮琦.基于聚类分析和双边匹配的产品开发任务分配方法[J].计算机集成制造系统,2017,23(4):717-725. 被引量：6
10李燕梅.一种基于全局K-均值聚类的改进算法[J].电脑与电信,2017(11):25-27.

同被引文献55

1钱鑫,张龙波,田爱奎,邓齐志,汪金苗.一种面向数据密集型计算环境的聚类算法[J].济南大学学报（自然科学版）,2013,27(1):11-15. 被引量：3
2高桂凤,魏华,严宝杰.城市公交服务质量可靠性评价研究[J].武汉理工大学学报（交通科学与工程版）,2007,31(1):140-143. 被引量：38
3秦军,付珍珍,王小丽.基于蚁群的Ad Hoc网络分簇路由算法[J].计算机技术与发展,2012,22(1):72-75. 被引量：8
4李震宇,胡歆竹,顾侃.浅谈定制公交发展现状及启示[J].城市道桥与防洪,2014(11):26-27. 被引量：7
5张雅琼.基于K-Means的无线传感网均匀分簇路由算法研究[J].控制工程,2015,22(6):1181-1185. 被引量：23
6康琳,董增寿.基于簇头分级的改进非均匀分簇算法[J].传感技术学报,2015,28(12):1841-1845. 被引量：5
7冷昕,张树群,雷兆宜.改进的人工蜂群算法在神经网络中的应用[J].计算机工程与应用,2016,52(11):7-10. 被引量：13
8赵明,董力,李孟阳,高赐威,喻洁.基于时段聚类的峰谷电价时段确定方法研究[J].电力需求侧管理,2016,18(4):11-17. 被引量：7
9裴明阳,靳文舟,张伟罡.实时预约定制公交服务可行性分析[J].公路与汽运,2016(5):38-41. 被引量：3
10马继辉,王飞,王娇,涂文苑.定制公交站点和线路规划研究[J].城市公共交通,2017(2):21-25. 被引量：11

引证文献6

1李华昌,揭东帅,徐敏.电力市场化改革下的电价敏感性研究[J].中北大学学报（自然科学版）,2020,41(5):431-436. 被引量：4
2万珊,苟文博.基于改进K-means聚类的数据自动采集系统设计[J].自动化与仪器仪表,2020(10):108-112. 被引量：4
3李雪,南建国.基于IK-means聚类的分簇路由算法[J].计算机应用研究,2021,38(4):1149-1153.
4梁宇杰,宋瑞,王宇擎,吴兆田.面向首都大学生的定制公交线路规划模型及算法研究[J].大连交通大学学报,2021,42(4):1-6.
5李贞,刘海燕,刘策,李庆钰,刘刚.基于机器学习的K-Means聚类优化算法研究[J].数据挖掘,2022,12(1):20-26. 被引量：3
6马双宇,朴凤贤,李郡霆,汪义坤,袁宇航,臧陶亮.古代玻璃制品成分分析和鉴定的研究[J].建模与仿真,2022,11(6):1627-1635.

二级引证文献11

1朱志斌,马游春.远程低功耗钢桥测温系统设计[J].电子测量技术,2020,43(23):154-158. 被引量：4
2赵志海.基于大数据技术精细化社会治理系统研究[J].粘接,2021(6):72-76.
3谢涛,刘晓静,赵雪敏,曹清华,安玲.降电价政策对工业生产活动影响的实证研究[J].电力与能源,2021,42(4):373-380. 被引量：2
4张志丹,张帝,黄纯,邓威,唐海国,朱吉然.基于筛选电压数据的配电低压用户相别辨识方法[J].供用电,2022,39(1):58-64. 被引量：2
5韩俊,王保云.MeanShift算法在图像分割中的应用[J].现代计算机,2021,27(33):71-76. 被引量：5
6谢涛,刘晓静,赵雪敏,曹清华,安玲.降电价政策对工业生产活动影响的实证研究[J].现代工业经济和信息化,2022,12(1):195-198.
7宁春辉,孔萌,张家林,刘彦秋,张玉森.生物医学数据分析方法综述[J].数学建模及其应用,2022,11(1):1-15. 被引量：1
8欧萍.数据挖掘技术在软件工程中的应用[J].长江信息通信,2022,35(5):71-73. 被引量：3
9杜柏林.电力体制改革对发电企业的影响及其对策分析[J].集成电路应用,2022,39(5):224-225. 被引量：2
10刘晓峰,崔丛波,梁森.基于聚类算法的水情分析系统的探讨与研究[J].城镇供水,2022(6):91-96. 被引量：1

1周贤泉,宋威,张士昱,王晨妮.一种改进的蝙蝠算法[J].传感器与微系统,2019,38(11):139-143. 被引量：5
2任恒妮.大数据K-means聚类算法的研究与应用[J].信息技术,2019,43(11):20-23. 被引量：11
3韩新新.基于K-medoids的Chameleon算法分析[J].现代商贸工业,2019,40(34):195-196. 被引量：1
4温彬彬,王丽佳,李月朋,胡雪花,陈旭凤.一种基于流行排序的显著性目标检测的改进方法[J].科技视界,2019,0(29):186-187.
5张明艳,查晓锐.基于K-Means算法改进的NTP及其在用电信息采集系统中的应用[J].安徽工业大学学报（自然科学版）,2019,36(2):185-189. 被引量：2
6李石华,汪祎勤,周峻松,金宝轩.时空过程对象的LULC时空演变分析算法[J].测绘通报,2019(9):94-98.
7葛妍娇,郭宇,黄少华,刘道元,张蓉.基于智能感知网的物料配送动态优化方法[J].计算机工程与应用,2019,55(22):212-218. 被引量：8
8闫超群,张申,谢顺,曾松情,黄春梅,顾欣,曹莹,黄士新,黄显会.肌肉注射泰地罗新注射液对猪安全性研究[J].中国兽医杂志,2019,55(6):102-105. 被引量：2
9苗晟,董亮,董建娥,钟丽辉.基于蜂窝网结构的多目标自动辨识定位方法[J].计算机应用,2019,39(11):3343-3348. 被引量：2
10田奎蓉,孙华林,洪业,刘俊林,蔺国珍.芹菜对高血压大鼠降压效果的组织学观察[J].甘肃畜牧兽医,2019,49(9):43-47. 被引量：1

闽江学院学报

2019年第5期

浏览历史

内容加载中请稍等...

一种改进的K-Means算法被引量：6

参考文献7

二级参考文献52

共引文献92

同被引文献55

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种改进的K-Means算法 被引量：6

参考文献7

二级参考文献52

共引文献92

同被引文献55

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种改进的K-Means算法被引量：6