一种基于密度和距离的K-means聚类算法被引量：3

A K-means Clustering Algorithm based on Density and Distance

下载PDF

导出

摘要针对K-means算法中对初始聚类中心和孤立点敏感的缺点,我们通过从密度和距离两个方面的改进,提出新的改进K-means算法。该算法引入特征权重,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,在距离计算过程中,引入集成簇内与簇间距离的计算方法,以提升聚类的效果。实验结果表明,该算法比传统聚类算法能够提升10%以上的聚类效果。 In order to improve the sensitivity of initial clustering centers and outliers of K-means algorithm,an improved K-means algorithm is proposed based on density and distance.In this algorithm,feature weight is introduced to remove the influence of outliers on the algorithm from the neighborhood density.At the same time,the initial clustering center is determined.In the process of distance calculation,the distance calculation method within and between clusters is introduced to improve the clustering effect.The experimental results show that this algorithm improves the clustering effect by more than 10%,compared with the traditional clustering algorithm.

作者罗军锋洪丹丹 LUO Junfeng;HONG Dandan(Network Information Center,Xi'an Jiaotong University,Xi'an 710049,China)

机构地区西安交通大学网络信息中心

出处《软件工程》 2020年第10期23-25,4,共4页 Software Engineering

关键词聚类 K-MEANS 特征加权近邻密度孤立点 clustering K-means feature weighting neighbor density isola ted points

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1邢长征,谷浩.基于平均密度优化初始聚类中心的k-means算法[J].计算机工程与应用,2014,50(20):135-138. 被引量：32
2曹志宇,张忠林,李元韬.快速查找初始聚类中心的K_means算法[J].兰州交通大学学报,2009,28(6):15-18. 被引量：19
3张建民.一种改进的K-means聚类算法[J].微计算机信息,2010,26(9):233-234. 被引量：17
4黄晓辉,王成,熊李艳,曾辉.一种集成簇内和簇间距离的加权k-means聚类方法[J].计算机学报,2019,42(12):2836-2848. 被引量：42
5莫锦萍,陈琴,马琳,苏一丹.一种新的K-Means蚁群聚类算法[J].广西科学院学报,2008,24(4):284-286. 被引量：7

二级参考文献35

1高继森,赵杰,张忠辅,张晶.增强型K-means聚类算法在入侵检测中的应用[J].微计算机信息,2008,24(9):72-73. 被引量：5
2蒋盛益,李庆华.一种增强的k-means聚类算法[J].计算机工程与科学,2006,28(11):56-59. 被引量：15
3袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
4MacQueen J. Some methods for classification and analysis of multivariate observations: proc of the 5th Berkeley Symp on Math Statist[C]. 1967 : 281-297.
5Kaufman J , Rousseeuw P J. Finding groups in data :an introduction to cluster analysis [M]. New York: John Wiley & Sons, 1990.
6N Labroche, N Monmarche, G Venturini. A new clustering algorithm based on the chemical recognition system of ants: proc of 15th European Conference on Artificial Intelligence ( ECAI 2002 ) [ C ]. Lyon FRANCE, 2002 : 345-349.
7Nicolas Labroche, Nicolas Monmarche ,Gilles Venturini Web sessions clustering with artificial ants colonies [EB/OL]. [ 2006-01-12 ]. http://www. hant. i.univtours fr/webhant/pub/LabMonVen03a. www. pdf
8Nicolas Labroche, Nicolas Monmarche ,Gilles Venturini. AntClust: ant clustering and web usage ming [C]. Genetic and Evolutionary Computation, 2003 : 25-36.
9Yang Y, Kamei M. Clustering ensemble using swarm intelligence: IEEE Swarm Intelligence Symposium [M]. Piscataway, NJ: IEEE Service Center, 2003: 65-71.
10Parag M Kanade, Lawrence O Hall. Fuzzy ants as a clustering concept: proc of the 22nd International Conference of the North American Fuzzy Information Processing Society[C]. 2003: 227-232.

共引文献110

1张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
2陆蓓,程肖,谌志群.基于改进蚁群聚类的热点主题发现算法研究[J].现代图书情报技术,2010(4):66-71. 被引量：4
3刘丛林,张忠林,曾庆飞.PSO算法在关联规则挖掘中的应用[J].兰州交通大学学报,2010,29(3):96-99. 被引量：4
4傅德胜,周辰.基于密度的改进K均值算法及实现[J].计算机应用,2011,31(2):432-434. 被引量：76
5李小展.基于半监督的K-means聚类改进算法[J].东莞理工学院学报,2011,18(1):29-32. 被引量：1
6卫俊霞,相里斌,高晓惠,段晓峰.基于K-均值聚类与夹角余弦法的多光谱分类算法[J].光谱学与光谱分析,2011,31(5):1357-1360. 被引量：13
7刘奇亮,欧阳高飞,谢宏威,邝泳聪,张宪民.一种快速的自动光学检测路径规划算法[J].微计算机信息,2011,27(4):232-234. 被引量：2
8傅涛,孙亚民.基于PSO的k-means算法及其在网络入侵检测中的应用[J].计算机科学,2011,38(5):54-55. 被引量：34
9周锐,胡学钢.基于聚类的决策树连续属性离散化改进算法[J].微计算机信息,2011,27(6):183-184. 被引量：1
10陈建国.一种海量数据挖掘的有效方法[J].软件,2011,32(5):65-66. 被引量：2

同被引文献33

1梁武昌.民航局:疫情防控指南再升级持续优化措施防输入[J].广东交通,2020,0(2):49-49. 被引量：1
2刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
3范辉,王义民.河南省耕地资源可持续利用水平等级差异变动分析[J].信阳师范学院学报（自然科学版）,2009,22(3):414-417. 被引量：2
4黄雪莲,杨传勇,梁敬祖.ArcGIS Engine中矢量数据叠加分析的实现及应用[J].城市勘测,2010(3):38-40. 被引量：16
5周爱武,于亚飞.K-Means聚类算法的研究[J].计算机技术与发展,2011,21(2):62-65. 被引量：134
6张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
7王炳南,王兴,李杨,杨鹏飞,冉宁培.中国职业足球道德风险的评价指标体系构建原则探析[J].体育科技,2014,35(4):54-55. 被引量：1
8王艳辉,冯百侠.用聚类分析法分析我国区域经济发展水平[J].价值工程,2016,35(2):72-73. 被引量：7
9史新颖,夏元平,毛曦,殷红梅.DBSCAN与Kmeans相结合的手机大数据聚类方法研究[J].北京测绘,2019,33(2):132-137. 被引量：12
10张奔.基于层次分析模糊集合数学期望值的煤矿应急能力评估[J].现代矿业,2015,31(12):175-177. 被引量：3

引证文献3

1千月欣,王永忠,李佳骏,万连成.疫情常态化下国际航线通航评估[J].民航学报,2021,5(2):19-24.
2张一丁,金宝轩,宋炜炜.基于POI的昆明市商业空间结构特征分析[J].城市勘测,2021(6):56-60.
3王红霞,赵丽.基于AKD-means算法对轨迹数据的聚类研究[J].信息技术与信息化,2023(5):111-114.

1朱红,侯高雁.基于PowerScan三维扫描仪的点云数据处理方法[J].信息记录材料,2019,20(11):148-150.
2贾子琪,宋玲.一种面向混合型数据聚类的k-prototypes聚类算法[J].小型微型计算机系统,2020,41(9):1845-1852. 被引量：6
3刘应扬.木材横纹抗拉力学性能改善方法试验简介[J].结构工程师,2020,36(4).
4官恺,刘智,金飞,韩佳容,芮杰.一种用于DSM局部缺失的深度学习修复算法[J].测绘科学技术学报,2020,37(3):281-286. 被引量：3
5戴剑勇,邓先红,王彬,汪恒浩.基于改进萤火虫优化神经网络的WSNs分簇路由协议[J].北京邮电大学学报,2020(3):131-137. 被引量：10
6刘应扬,聂熙哲,黎章,张天齐,徐勇.木材横纹抗拉力学性能改善方法试验研究[J].结构工程师,2020,36(4):120-127. 被引量：2
7刘丽伟,赵红超.一种面向WSN-物联网中能效的簇路由[J].传感技术学报,2020,33(7):1056-1060. 被引量：3
8张文柱,孙瑞华,高鹏,孔维鹏.基于梯度的异构WSNs非均匀分簇路由协议[J].小型微型计算机系统,2020,41(9):1887-1892. 被引量：4

软件工程

2020年第10期

浏览历史

内容加载中请稍等...

一种基于密度和距离的K-means聚类算法被引量：3

参考文献5

二级参考文献35

共引文献110

同被引文献33

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于密度和距离的K-means聚类算法 被引量：3

参考文献5

二级参考文献35

共引文献110

同被引文献33

引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于密度和距离的K-means聚类算法被引量：3