对k-means聚类算法的改进被引量：47

Improved k-means Clustering Algorithm

下载PDF

导出

摘要提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。 This paper investigates the standard k-means clustering algorithm and gives an improved algorithm by selecting better initial centers that the algorithm begins with.First the paper computes distances between data points;then tries to find out the data points that are similar;finally constructs initial centers according to these data points.In the experiment,authors find that different data points lead to different results.If people can find initial centers that are consistent with the distribution of data,people could get good clusterings.According to the experiment,the improved k-means Clustering Algorithm can get higher accuracy.

作者袁方孟增辉于戈

机构地区东北大学信息科学与工程学院河北大学数学与计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2004年第36期177-178,232,共3页 Computer Engineering and Applications

基金河北省自然科学基金(编号:603137) 河北省教育厅科研计划(编号:2001206 2002154)资助

关键词 K-MEANS聚类算法聚类模式识别 k-means clustering algorithm,clustering,pattern recognition

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1La Jolla. Alternatives to the k-means algorithm that find better clustering. Department of Computer Science and Engineering,University of California,San Diego,CA92093
2Kaufan L,Rousseeuw PJ.Finding Groups in Data:an Introduction to Cluster Analysis[M].New York:John Wiley & Sons, 1990
3Guha S,Rastogi R,Shim K.CURE:an efficient clustering algorithm for large databases[C].In:Haas LM,Tiwary A eds.Proceedings of the ACM SIGMOD International Conference on Management of Data,Seattle: ACM Press, 1998: 73～84
4Agrawal R,Gehrke J,Gunopolos D et al. Automatic subspace clustering of high dimensional data for data mining application[C].In:Haas LM,Tiwary A eds. Proceedings of the ACM SIGMOD International Conference on Management of Data, Seattle: ACM Press, 1998: 94～105

同被引文献310

1田地,张西芝,刘小航.一种基于扩展的K-means聚类算法[J].河南教育学院学报（自然科学版）,2007,16(2):26-28. 被引量：3
2冯汉中,陈永义.处理非线性分类和回归问题的一种新方法(Ⅱ)——支持向量机方法在天气预报中的应用[J].应用气象学报,2004,15(3):355-365. 被引量：120
3杜启振,杨少春,王志欣,徐守余,郭玉新.测井相模式识别自动分析[J].石油物探,1997,36(S1):108-111. 被引量：13
4蔺景龙,张淑梅.测井相分析方法的研究[J].大庆石油学院学报,1993,17(1):16-22. 被引量：9
5王建会,申展,胡运发.一种实用高效的聚类算法[J].软件学报,2004,15(5):697-705. 被引量：26
6李雄,徐肖豪.空中交通地面等待的指派问题模型[J].中国民航学院学报,2004,22(B06):87-90. 被引量：8
7何曰光.模糊聚类算法及应用[J].石油仪器,2004,18(3):43-44. 被引量：11
8荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
9王天鹏,姜挺.基于模糊算子理论的道路半自动提取[J].测绘学院学报,2004,21(3):187-189. 被引量：4
10余芳,姜云飞.一种基于朴素贝叶斯分类的特征选择方法[J].中山大学学报（自然科学版）,2004,43(5):118-120. 被引量：24

引证文献47

1周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
2楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
3印勇,蒋海娜.优化初始聚类中心的关键帧提取[J].计算机工程与应用,2007,43(21):165-167. 被引量：6
4汪力,冯源,张持健.链状分布的神经网络聚类分析[J].计算机工程与应用,2007,43(26):72-73.
5沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
6连凤娜,吴锦林,唐琦.一种改进的K-means聚类算法[J].电脑与信息技术,2008,16(1):38-40. 被引量：23
7赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：74
8耿筱媛,张燕平,闫屹.改进的K-means算法在电信客户细分中的应用[J].计算机技术与发展,2008,18(5):163-167. 被引量：6
9郭红艳,谷保平.改进k均值算法在网络入侵检测中的应用研究[J].计算机安全,2008(5):24-26. 被引量：3
10张琼,张莹,白清源,谢丽聪,谢伙生.基于Leader的K均值改进算法[J].福州大学学报（自然科学版）,2008,36(4):493-496. 被引量：3

二级引证文献500

1周晓,朱晗雨.基于Hadoop的高压输电线路合闸故障诊断方法[J].数字制造科学,2022(2):104-110. 被引量：1
2刘苓君.我国养老模式研究热点的知识图谱分析[J].老龄科学研究,2020(11):39-48. 被引量：1
3付旭东,王金艳,李龙燕,陈金车,苏士翔,常伟,王明.基于随机森林算法的风场预报[J].兰州大学学报（自然科学版）,2021,57(4):503-509. 被引量：5
4宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：23
5楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
6闵燚,罗钊.简析当前主要的视频关键帧提取技术[J].广西警官高等专科学校学报,2010,23(4):53-56. 被引量：1
7陈寿文,李明东.基于面向对象思想KMeans算法实现[J].滁州学院学报,2008,10(3):42-44. 被引量：7
8步媛媛,关忠仁.基于K-means聚类算法的研究[J].西南民族大学学报（自然科学版）,2009,35(1):198-200. 被引量：22
9顾洪博,张继怀.基于孤立点和初始质心选择的k-均值改进算法[J].长江大学学报（自科版）（上旬）,2009,6(1):60-62. 被引量：7
10宋文功,龙军.k均值算法在网络入侵检测中的应用[J].微计算机信息,2009,25(15):42-43. 被引量：2

1步媛媛,关忠仁.基于K-means聚类算法的研究[J].西南民族大学学报（自然科学版）,2009,35(1):198-200. 被引量：22
2谢会娟,佘为,钟声.基于ASP.NET实现随机选取考题的研究[J].信息技术,2010,34(9):66-68. 被引量：1
3张凤蛟.快速曲线拟合的方法[J].延边大学学报（自然科学版）,2006,32(3):208-211. 被引量：4
4江健生,朱会萍.基于直方图的K-means聚类中心自动检测方法[J].廊坊师范学院学报（自然科学版）,2013,13(2):49-52. 被引量：3
5邹汉斌,周学清.基于聚类的模糊支持向量机入侵检测算法[J].情报杂志,2009,28(3):175-178. 被引量：3
6刘建勋.VB利用随机函数选号的程序设计[J].中国科教博览,2004(8):60-66.
7刘涛,马晓宇,胡景.一种K-MEANS算法在网络异常检测中的应用[J].微电子学与计算机,2012,29(5):42-45. 被引量：5
8员世芬,张金梅,田建艳.小波神经网络初始值的选择[J].电脑开发与应用,2005,18(2):37-38. 被引量：3
9曾昭贤,张茂军,王炜,熊志辉.基于样本点能量扩散模型的聚类[J].计算机应用,2011,31(9):2534-2537. 被引量：1
10李红,吴粉侠.基于模糊C均值的图像分割[J].网络安全技术与应用,2014(8):126-126.

计算机工程与应用

2004年第36期

浏览历史

内容加载中请稍等...

对k-means聚类算法的改进被引量：47

参考文献4

同被引文献310

引证文献47

二级引证文献500

相关作者

相关机构

相关主题

浏览历史

对k-means聚类算法的改进 被引量：47

参考文献4

同被引文献310

引证文献47

二级引证文献500

相关作者

相关机构

相关主题

浏览历史

对k-means聚类算法的改进被引量：47