基于Python的K-means算法实现方式对比研究被引量：3

Research of K-means Algorithm Programming Based on Python

下载PDF

导出

摘要大数据时代的到来使Python语言受到越来越多的关注。在国际上,IEEE颁布的顶级编程语言交互排行榜中,Python已连续多年名列榜首,在国内,Python已经进入义务教育阶段小学课程。Python以其可读性强、使用范围广受到越来越多计算机使用人员的欢迎。Python在数据处理方面光彩夺目的表现得益于和其他过程控制语言的巨大不同,本文以经典K-means算法的实现为切入点,通过不同的编程方式实现同样的聚类过程,在UCI和生成数据集上分别运行不同程序,发现采用Numpy数据处理库可以显著提升程序运行效率,减少运行时间,展现出Python向量式数据计算的巨大优势。 With the advent of the big data era,python language has attracted more and more attention.Internationally,in the top programming language interaction ranking released by IEEE,python has been ranked first for many years.In China,python has entered primary school.Python is widely used by more and more computer users because of its readability.However,Python's advantages in data processing are also shown out of the huge differences of other process control languages.This paper takes the implementation of the classic k-means algorithm as an examples,program the same clustering process by different programming methods,run the program on the UCI and generating data set respectively,we found that using numpy data processing library can significantly improve the running efficiency of the program and reduce the running time,so then show the huge advantages of Python vector data computing.

作者王习涛 WANG Xi-tao(Statistics Bureau Data Management Center of Henan Province,Henan Zhengzhou 410018)

机构地区河南省统计局数据管理中心

出处《软件》 2020年第8期87-88,128,共3页 Software

关键词 PYTHON K-MEANS Numpy 聚类 Python K-means Numpy Cluster

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2邓滨玥.K均值优化算法综述[J].软件,2020,41(2):188-192. 被引量：12
3杨俊闯,赵超.K-Means聚类算法研究综述[J].计算机工程与应用,2019,55(23):7-14. 被引量：281
4章永来,周耀鉴.聚类算法综述[J].计算机应用,2019,39(7):1869-1882. 被引量：204
5黄韬,刘胜辉,谭艳娜.基于k-means聚类算法的研究[J].计算机技术与发展,2011,21(7):54-57. 被引量：87

二级参考文献54

1郝占刚,王正欧.基于遗传算法和k-medoids算法的聚类新算法[J].现代图书情报技术,2006(5):44-46. 被引量：5
2Tan Pang-Ning,Steinbach M,Kuma V.Introduction to DataMining[M].北京:人民邮电出版社,2006:5-28.
3Hand D J,Vinciotti V.Choosing k for two-class nearest neighbor classifiers with unbalance classes[J].Pattern Recognition Letter,2003,24(9):1555-1562.
4Cuba S,Rastogi R,Shim K.CURE:An efficient clustering algorithm for large databases[C]//In:Hass L M,Tiwary A.Proc.of the ACM SIGMOD Int'1 Conf.on Management of Data.New York:ACM Press,1998:73-84.
5Harmer P K,Williams P D,Gunsch G H.An Artificial Immune System Architecture for Computer Security Applications[J].IEEE Transactions on Evolutionary Computation,2002,6(3):252-280.
6Yang M S,Hu Y J,Lin K C R,et al.Segmenttation techniques for tissue differentiation in MRI of ophthalmology using fuzzy clustering algorithm[J].Magnetic Resonance Imaging,2002(20):173-179.
7Han Jiawei, Micheline Kamber. Data mining concepts and techniques[M].北京:机械工业出版社,2006.
8徐克圣,王澜.一种自动获得k值的聚类算法[J].大连交通大学学报,2007,28(4):68-71. 被引量：3
9孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
10雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：113

共引文献729

1王炳琪,聂潇乾,严鹏,吴彬彬,高承帅.多站点低空防御系统关键技术研究[J].制导与引信,2019,0(4):17-22.
2杜康,周恒为,丁明明,叶峰,石彤非.聚类分析橡胶炭黑填充量与Yeoh模型参数的关联[J].应用化学,2021,38(6):675-684. 被引量：3
3李小波,刘威,李健.基于模糊聚类分析方法的高含水期油藏层系优化[J].当代化工,2019,0(11):2630-2633. 被引量：2
4许毅超.基于人工智能算法的河道智能监控预警系统研究及应用[J].水利科技,2023(4):29-31. 被引量：1
5王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
6冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
7许文坚,高维新,程耀坤.基于钻石模型的广东省生猪产业竞争力评价分析[J].现代畜牧兽医,2022(12):56-62. 被引量：2
8胡小鹏,赵永杰,黄可心,项彦澍,梁冬泰,冯永飞,梁丹.基于深度学习与超像素的乒乓球运动轨迹检测[J].机械制造,2022,60(8):81-86. 被引量：4
9刘振宇,丁宇祺.自然环境中被遮挡果实的识别方法研究[J].计算机应用研究,2020,37(S02):333-335. 被引量：6
10张仲宸,周浩,林波荣,李嘉麒,田昕,吴佳欣,陈帅元,黄莉.基于数据挖掘的办公建筑运行阶段碳排放分析[J].建筑节能,2020,48(11):1-6. 被引量：8

同被引文献10

1程泽凯 ,林士敏 .文本分类器准确性评估方法[J].情报学报,2004,23(5):631-636. 被引量：13
2张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量：98
3周世兵,徐振源,唐旭清.K-means算法最佳聚类数确定方法[J].计算机应用,2010,30(8):1995-1998. 被引量：142
4周爱武,于亚飞.K-Means聚类算法的研究[J].计算机技术与发展,2011,21(2):62-65. 被引量：134
5王爱莲,伍伟丽,陈俊杰.基于K-means聚类算法的图像分割方法比较及改进[J].太原理工大学学报,2014,45(3):372-375. 被引量：8
6薛芯菊.基于Python的K-means算法及其应用[J].科技视界,2018(24):141-142. 被引量：8
7多杰措,安见才让.藏文应用文文本自动分类研究[J].信息技术与信息化,2019(5):225-227. 被引量：1
8任远航.面向大数据的K-means算法综述[J].计算机应用研究,2020,37(12):3528-3533. 被引量：15
9陈琛.基于Python的企业网络智能化运维研究[J].电子技术与软件工程,2021(1):39-40. 被引量：4
10崔东虎,赵亚慧,崔荣一.基于相对熵的KNN文本分类方法的研究[J].延边大学学报（自然科学版）,2021,47(2):175-179. 被引量：7

引证文献3

1罗平娟,张胜礼.基于K-means聚类算法的物流配送方案设计[J].现代计算机,2021,27(24):26-29. 被引量：6
2张维利,高翔,荆元强.关于5G基站功率license智能调度研究[J].长江信息通信,2022,35(5):180-182.
3吴玉龙,卓嘎,扎西平措,赵智龙,吴绍乾.基于H-KNN的藏文字符的识别研究[J].现代信息科技,2022,6(8):92-94.

二级引证文献6

1何立蜓.基于K-means聚类算法的防汛物资调配改进模型[J].人民黄河,2021,43(S02):272-275. 被引量：1
2刘明燕.基于Lingo软件的货物配送方案研究[J].科技与创新,2022(7):78-80. 被引量：1
3徐秀珍,张媛媛,卢安文.基于K-means聚类模型的留学生多维度分层教学研究[J].现代计算机,2022,28(4):70-75.
4陈悦.基于数据挖掘的生鲜电商仓配体系设计[J].电脑编程技巧与维护,2022(11):78-81.
5张亚林.基于K均值聚类算法的景区旅游最佳路线定制[J].电脑编程技巧与维护,2023(11):65-68.
6刘欣欣,栗振锋,李兴莉,许家欢.基于两阶段法的车+无人机配送模式路径研究[J].太原科技大学学报,2024,45(4):409-414.

1付亚芹.VR电影的视听语言交互设计研究[J].艺术评鉴,2019,0(22):174-175. 被引量：1
2刘冰林,吴景东.从肺脾论治湿疹的探讨[J].实用中医内科杂志,2020,34(1):31-34. 被引量：6
3程润.丹麦留学体验“童话王国”的优质教育[J].留学,2020(14):70-72.
4张晶.勿使所知成障——助读《领导力陷阱》[J].人力资源,2020(11):98-101.
5霍晓凯,史冬辉,石一锐,周柚,时小虎,吴春国.口语对话系统中对话管理的演变[J].吉林大学学报（信息科学版）,2019,37(6):623-630. 被引量：4
6丛志鹏.慢综艺类节目艺术表达和情感传递分析——以《向往的生活》为例[J].传播力研究,2020(5):47-47. 被引量：1
7晓苏,廖栋雯.论非虚构作品的语言特征[J].当代文坛,2020(4):105-110. 被引量：1
8陈志旗.二语交互理论视域下的外语课堂交互性任务实施[J].江西电力职业技术学院学报,2020,33(2):52-53.
9王志.藏在沂蒙山区的税务英雄[J].瞭望,2020(30):23-25.
10黄信.藏族典籍《萨迦格言》译者主体性研究[J].西藏研究,2020,0(1):79-86. 被引量：1

软件

2020年第8期

浏览历史

内容加载中请稍等...

基于Python的K-means算法实现方式对比研究被引量：3

参考文献5

二级参考文献54

共引文献729

同被引文献10

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Python的K-means算法实现方式对比研究 被引量：3

参考文献5

二级参考文献54

共引文献729

同被引文献10

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Python的K-means算法实现方式对比研究被引量：3