期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

Improved k-means clustering algorithm 被引量：16

一种改进的k-means聚类算法(英文)

下载PDF

导出

摘要 In allusion to the disadvantage of having to obtain the number of clusters of data sets in advance and the sensitivity to selecting initial clustering centers in the k-means algorithm, an improved k-means clustering algorithm is proposed. First, the concept of a silhouette coefficient is introduced, and the optimal clustering number Kopt of a data set with unknown class information is confirmed by calculating the silhouette coefficient of objects in clusters under different K values. Then the distribution of the data set is obtained through hierarchical clustering and the initial clustering-centers are confirmed. Finally, the clustering is completed by the traditional k-means clustering. By the theoretical analysis, it is proved that the improved k-means clustering algorithm has proper computational complexity. The experimental results of IRIS testing data set show that the algorithm can distinguish different clusters reasonably and recognize the outliers efficiently, and the entropy generated by the algorithm is lower. 针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.

作者夏士雄李文超周勇张磊牛强

机构地区中国矿业大学计算机科学与技术学院

出处《Journal of Southeast University(English Edition)》 EI CAS 2007年第3期435-438,共4页 东南大学学报（英文版）

基金 The National Natural Science Foundation of China(No50674086) Specialized Research Fund for the Doctoral Program of Higher Education (No20060290508) the Youth Scientific Research Foundation of China University of Mining and Technology (No2006A047)

关键词 CLUSTERING k-means algorithm silhouette coefficient 聚类 k-means算法轮廓系数

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献142

1田地,张西芝,刘小航.一种基于扩展的K-means聚类算法[J].河南教育学院学报（自然科学版）,2007,16(2):26-28. 被引量：3
2刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
3张磊,耿立格,王丽娜,张动敏.不同玉米自交系萌芽期的抗旱性研究[J].玉米科学,2010,18(4):77-81. 被引量：22
4王燕.一种改进的K-means聚类算法[J].计算机应用与软件,2004,21(10):122-123. 被引量：9
5袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
6胡士强,敬忠良.粒子滤波算法综述[J].控制与决策,2005,20(4):361-365. 被引量：293
7耿立格,李灵芝,王丽娜,于前,吉京良.河北省农作物种质资源特性评价鉴定信息系统的建立[J].河北农业科学,2005,9(2):70-72. 被引量：9
8秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
9沈显君,王伟武,郑波尽,李元香.基于改进的微粒群优化算法的0-1背包问题求解[J].计算机工程,2006,32(18):23-24. 被引量：28
10贾丽会,张修如.BP算法分析与改进[J].计算机技术与发展,2006,16(10):101-103. 被引量：47

引证文献16

1覃俊,易云飞,李林.改进k均值聚类算法在网络入侵检测中的应用研究[J].中南民族大学学报（自然科学版）,2008,27(3):75-78. 被引量：9
2朱牧,孟凡荣,周勇.一种确定聚类数目的自组织特征映射网络[J].微电子学与计算机,2009,26(8):233-236.
3杜歆,陈建娟,王选贺.一种基于高斯概率模型的多人跟踪算法[J].传感技术学报,2009,22(9):1298-1302. 被引量：1
4拓守恒.基于QPSO训练的SVM核函数集成学习研究[J].系统仿真技术,2010,6(3):202-208. 被引量：5
5王臣,叶春涛.基于K-Means及K-NN的磁共振颅脑图像分割初探[J].上海医学影像,2011,20(1):9-11.
6陈福集,蒋芳.基于2d-距离改进的K-means聚类算法研究[J].太原理工大学学报,2012,43(2):114-118. 被引量：8
7刘晓晨,贾文霄,王红,王云玲,马景旭,周璇,王皓.影像学对兔腰椎结核模型的早期评价[J].实用放射学杂志,2014,30(8):1387-1391. 被引量：1
8宋洪涛,王小峰,王勇军,常帅.基于信息熵的分布式拒绝服务攻击协同检测系统的设计与实现[J].小型微型计算机系统,2015,36(1):133-137. 被引量：5
9周娟.基于DKC值的K-means改进聚类算法的研究[J].企业技术开发,2015,34(1):24-26.
10陈晓,赵晶玲.大数据处理中混合型聚类算法的研究与实现[J].信息网络安全,2015(4):45-49. 被引量：30

二级引证文献88

1张敏杰,徐宁,胡俊华,王宇飞,李晨,徐剑波,张诗玉.面向变压器智能运检的知识图谱构建和智能问答技术研究[J].全球能源互联网,2020,3(6):607-617. 被引量：13
2李林,易云飞,黄潜,覃俊.基于矩阵的模糊关联规则挖掘算法及其应用研究[J].现代电子技术,2009,32(20):69-72. 被引量：2
3蒋庆丰,李梓,程晓旭.K-Means聚类算法研究及图形演示的实现[J].信息技术,2010,34(3):23-25. 被引量：8
4于丽.一种改进的K-means聚类算法[J].辽宁师专学报（自然科学版）,2010,12(2):1-1. 被引量：3
5胡苓苓,郭业才.基于QPSO的小波分数间隔盲均衡算法[J].计算机工程,2011,37(24):195-197. 被引量：3
6郭业才,胡苓苓,丁锐.基于量子粒子群优化的正交小波加权多模盲均衡算法[J].物理学报,2012,61(5):281-287. 被引量：16
7陈光平,王文鹏,黄俊.一种改进初始聚类中心选择的K-means算法[J].小型微型计算机系统,2012,33(6):1320-1323. 被引量：39
8易云飞,陈国鸿.基于k-means的改进粒子群算法求解TSP问题[J].微计算机信息,2012(9):475-477. 被引量：5
9易云飞,张志平,蔡永乐,林郭隆.k-means算法在网络入侵检测中的应用研究[J].软件导刊,2013,20(2):124-126. 被引量：5
10任培花,王丽珍.不确定域环境下基于DKC值改进的K-means聚类算法[J].计算机科学,2013,40(4):181-184. 被引量：7

1何莹,秦亮曦.基于PCA的H-K聚类算法研究[J].微计算机信息,2012,28(6):163-165. 被引量：3
2葛亮,郎江涛,唐黄,唐允恒.面向高维数据的PCA-Hubness聚类方法[J].现代计算机（中旬刊）,2017(4):52-55. 被引量：1
3安计勇,闫子骥,翟靖轩.基于距离阈值及样本加权的K-means聚类算法[J].微电子学与计算机,2015,32(8):135-138. 被引量：8
4朱连江,马炳先,赵学泉.基于轮廓系数的聚类有效性分析[J].计算机应用,2010,30(12):139-141. 被引量：117
5黄周宽,成晓宁,迟全洲.齿轮箱故障诊断的粒子群优化模糊聚类技术[J].新技术新工艺,2012(10):101-104.
6安计勇,韩海英,侯效礼.一种改进的DBscan聚类算法[J].微电子学与计算机,2015,32(7):68-71. 被引量：13
7张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
8张士豪,顾益军,张俊豪.微博自动分类系统设计[J].信息网络安全,2016(1):81-87. 被引量：5
9安计勇,高贵阁,史志强,孙磊.一种改进的K均值文本聚类算法[J].传感器与微系统,2015,34(5):130-133. 被引量：19
10王景中,张存正.用于网络行为分析的一种改进K-means算法[J].北方工业大学学报,2016,28(1):24-27. 被引量：1

Journal of Southeast University(English Edition)

2007年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部