通过密度思想和聚类有效性指标改进的K-means算法被引量：9

K-means algorithm improved by density thinking and clustering validity index

下载PDF

导出

摘要 K-means算法是常用的一种聚类分析算法。通常预先选取一个k值,然后再通过选取初始聚类中心进行聚类,直到结果不再收敛。但是传统K-means算法存在k值和初始中心点如何选取的问题,因此针对这一缺陷进行改进。通过密度参数的计算和考虑样本之间距离因素来选取初始聚类中心,并且对聚类有效性指标DBI进行改进,得到新的聚类有效性指标函数IDBI来分析不同k值下的聚类结果,从而得出最佳聚类数。结果表明,IDBI值普遍比DBI小,更加趋于稳定,因此该算法相比传统算法具有更好的收敛性以及更高的准确性。 K-means algorithm is a commonly used algorithm for clustering analysis. Usually,a k value is selected in advance,and then clustering is performed by selecting the initial clustering center,until the result is no longer convergent.However,it is difficult for the traditional K-means algorithms to select the k value and the initial centering point,so an improvement is implemented. The initial clustering center is selected by calculating the density parameter and considering the distance between the samples,and the clustering validity index DBI(Davies-Bouldin index) is improved to obtain a new clustering validity index function IDBI to analyze different k values,so as to get the optimal number of clustering. The results show that the value of IDBI is generally smaller than that of DBI and tends to be more stable. Therefore,this algorithm can get better convergence and higher accuracy than the traditional algorithms.

作者马钰莫路锋 MA Yu;MO Lufeng(School of Information Engineering,Zhejiang A&F University,Hangzhou 311300,China)

机构地区浙江农林大学信息工程学院

出处《现代电子技术》 2021年第17期120-123,共4页 Modern Electronics Technique

基金国家自然科学基金两化融合重点项目(U1809208) 国家自然科学基金资助项目(61190114) 国家自然科学基金资助项目(61303236) 浙江省自然科学基金资助项目(LY16F020036)。

关键词 K-MEANS 聚类密度思想聚类分析初始中心选取优化 k值优化 IDBI聚类有效性指标 K-means clustering density idea clustering analysis initial center selection optimization k value optimization IDBI clustering effectiveness index

分类号 TN911.1-34 [电子电信—通信与信息系统] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献14

1吴夙慧,成颖,郑彦宁,潘云涛.K-means算法研究综述[J].现代图书情报技术,2011(5):28-35. 被引量：166
2唐泽坤,朱泽宇,杨裔,李彩虹,李廉.基于距离和密度的d-K-means算法[J].计算机应用研究,2020,37(6):1719-1723. 被引量：12
3任江涛,施潇潇,孙婧昊,黄焕宇,印鉴.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学,2006,33(7):186-187. 被引量：10
4赵燕伟,朱芬,桂方志,任设东,谢智伟,徐晨.基于可拓距的改进k-means聚类算法[J].智能系统学报,2020,15(2):344-351. 被引量：9
5王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：109
6王勇,唐靖,饶勤菲,袁巢燕.高效率的K-means最佳聚类数确定算法[J].计算机应用,2014,34(5):1331-1335. 被引量：64
7周世兵,徐振源,唐旭清.新的K-均值算法最佳聚类数确定方法[J].计算机工程与应用,2010,46(16):27-31. 被引量：90
8黄松,邱建林.改进的遗传k-means算法及其应用[J].计算机工程与设计,2020,41(6):1617-1623. 被引量：21
9韩琮师,李旭健.改进的K-means算法研究[J].软件,2020,41(3):21-23. 被引量：6
10王巧玲,乔非,蒋友好.基于聚合距离参数的改进K-means算法[J].计算机应用,2019,39(9):2586-2590. 被引量：27

二级参考文献192

1王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
2杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
3李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
4张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：57
5蒋盛益,李庆华.一种增强的k-means聚类算法[J].计算机工程与科学,2006,28(11):56-59. 被引量：15
6张逸清,刘文才.聚类数的确定[J].计算机与数字工程,2007,35(2):42-44. 被引量：7
7牛琨,张舒博,陈俊亮.融合网格密度的聚类中心初始化方案[J].北京邮电大学学报,2007,30(2):6-10. 被引量：16
8蔡龙飞.运用硬c均值改进kmeans算法的聚类分析[J].科技咨询导报,2007(24):144-145. 被引量：4
9Frey B J,Dueek D.Clustering by passing messages between data points[J].Science,2007,315:972-976.
10Frey B J,Dueck D.Response to comment on"clustering by passing messages between data points"[J].Science,2008,319.

共引文献647

1冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
2郭继红,李艳钰.基于RFID的水果包装和自动配送系统研究[J].农机化研究,2020,42(10):251-254. 被引量：3
3滑江,孙钰,周彦斌,蔡曙日,龚尚文.基于K-means方法的气象数据分区在公路养护的应用[J].公路交通科技,2022,39(S01):19-23.
4徐艺萍,邓辉文,李阳旭.一种新的最近邻聚类算法[J].西南师范大学学报（自然科学版）,2006,31(6):114-116. 被引量：8
5徐艺萍,邓辉文,徐永刚.一种改进的模糊C—均值聚类算法[J].徐州工程学院学报,2008(4):34-36. 被引量：2
6左晓飞,刘怀亮,范云杰,赵辉.基于概念语义场的文本聚类算法研究[J].情报杂志,2012,31(5):180-184. 被引量：2
7王生昌,李良敏,杨立本,邱兆文.营运车辆驾驶人适宜性甄别检测评价系统研究[J].交通信息与安全,2013,31(1):65-69. 被引量：2
8韩丽苹,孟海东,李海荣.聚类算法在矿产资源与经济发展关系研究中的应用[J].煤炭技术,2015,34(5):290-292.
9张新娟.一种基于改进粒子群算法的图像分类方法研究[J].自动化与仪器仪表,2016(7):163-164. 被引量：1
10张莉,孙钢,郭军.基于K-均值聚类的无监督的特征选择方法[J].计算机应用研究,2005,22(3):23-24. 被引量：29

同被引文献73

1杜佳颖,段隆振,段文影,卜秋瑾.基于Spark的改进K-means算法的并行实现[J].计算机应用研究,2020,37(2):434-436. 被引量：12
2徐惟馨,韦芸,夏静静,黄扬明,闵顺耕.FT-ICR MS对烟用香精香料配方一致性的研究[J].光谱学与光谱分析,2020,40(S01):313-314. 被引量：2
3王志强,陈思宇,吕雪锋,麻楠楠.风暴潮灾害受灾人口与直接经济损失评估方法研究进展[J].北京师范大学学报（自然科学版）,2015,51(3):274-279. 被引量：7
4陈建潭,王以礼,朱国清.浅谈卷烟企业烟用香精香料的分类与检测方法[J].烟草科技,1993,26(6):19-20. 被引量：4
5孙志涛.紫外-可见分光光度法在烟用香精香料质量评价中的应用[J].安徽农学通报,2010,16(2):144-147. 被引量：4
6亓晓振,王庆.一种基于稀疏编码的多核学习图像分类方法[J].电子学报,2012,40(4):773-779. 被引量：31
7雷林平.基于Savitzky-Golay算法的曲线平滑去噪[J].电脑与信息技术,2014,22(5):30-31. 被引量：44
8吴旭婧,许勇,张亚楠.基于指纹模式匹配的无线传感器网络密钥预分配方案[J].计算机工程,2015,41(3):106-109. 被引量：3
9苏兵,唐明,宋戈,张钰婧.一种基于功率控制的WSN分簇路由算法研究[J].测控技术,2015,34(9):95-98. 被引量：5
10温佩芝,许晨蛟,邓珍荣,黄文明.多级异构无线传感器网络分簇路由协议[J].计算机工程与设计,2016,37(6):1471-1477. 被引量：14

引证文献9

1富立琪,王华倩,乔学工.基于k-means分簇和灰狼优化的无线传感网络路由算法[J].电子设计工程,2021,29(23):1-6. 被引量：9
2曾怡苗.基于环形数据集的改进K-means聚类算法[J].软件,2021,42(11):74-76. 被引量：1
3牛永芹.基于K-means算法的行政事业单位预算支出内部控制预警研究[J].河北北方学院学报（自然科学版）,2022,38(7):43-49. 被引量：3
4孔繁春,王婷,李旭东.基于动态网格生成技术和k-means算法的电力客户行为分析方法[J].电子设计工程,2022,30(15):127-131. 被引量：4
5黄为.一种基于大数据的网络安全主动防御系统研究与设计[J].网络安全技术与应用,2022(9):59-61. 被引量：2
6王睿.基于K-means算法的网络主动安全防御系统研究与设计[J].网络安全技术与应用,2022(11):31-33. 被引量：2
7许致远,张慧.应急管理场景中的手机信令数据应用探索[J].移动通信,2022,46(10):77-81. 被引量：1
8苏东斌,李开开.紫外分光光度法结合化学计量学方法检验烟丝香精[J].化学研究与应用,2023,35(2):267-273. 被引量：2
9吴炜晨,许衍.基于点击数据的图像识别[J].电子设计工程,2023,31(8):101-104.

二级引证文献24

1王影,李莉,贾爽.建筑玻璃遮阳系数检测仪控制系统设计[J].天津职业技术师范大学学报,2023,33(4):30-35.
2赵伟哲,崔成,严干贵,何昊,熊华强,王俊茜,翟文超.用于次同步振荡分析的直驱风电场等值模型[J].智慧电力,2022,50(2):22-28. 被引量：12
3刘健,赵磐,张志华,王毅钊.放弃全局最优去寻找满意解--精英优化法[J].供用电,2022,39(6):1-5.
4胡长生.基于遗传算法的无线传感器网络安全分簇路由算法研究[J].南京工程学院学报（自然科学版）,2022,20(3):28-32. 被引量：4
5孙虹丽.行政事业单位内部控制有效性问题探究[J].中国经贸,2022(20):132-134.
6王喜敏,袁杰,寇巧媛.一种基于多策略的改进黏菌算法[J].广西师范大学学报（自然科学版）,2022,40(6):98-108. 被引量：1
7刘帅,马跃彭.基于可调负荷特性的用户响应潜力评估方法分析[J].集成电路应用,2022,39(12):291-293.
8戴兵,田博,高心雨,严李强.基于C-K-N-Cluster的居民出行时空特征分析[J].智能计算机与应用,2022,12(11):64-70.
9陈诗玫.建筑工程造价超预算的原因与控制策略研究[J].建筑与预算,2023(2):34-36. 被引量：10
10薛振华.基于数据特征融合的多层次网络空间安全防御系统[J].信息与电脑,2023,35(2):242-244. 被引量：2

1童婉迪.优化K-means算法在客户细分中的应用研究[J].景德镇学院学报,2021,36(3):21-24. 被引量：1
2张远琴,肖德琴,陈焕坤,刘又夫.基于改进Faster R-CNN的水稻稻穗检测方法[J].农业机械学报,2021,52(8):231-240. 被引量：10
3黄宝昆,张天贤,杨益川.可控性能偏好下的MIMO雷达站点优化配置方法[J].现代雷达,2021,43(7):14-20. 被引量：2
4程平,范洵,辜榕容.作业成本法下基于聚类算法的项目成本动因合并研究——以A风景园林规划研究院规划设计类项目为例[J].财会通讯,2021(18):94-98. 被引量：8
5苗俊先,赵一帆,朱元静,陈春,丁洪伟.WSN中遗传和K均值聚类的多跳路由算法[J].现代电子技术,2021,44(17):42-48. 被引量：3
6杜雯莉,牛云飞,苏强.基于聚类分析的综合物探解释技术研究[J].山东煤炭科技,2021,39(8):170-173. 被引量：1
7张天蛟,廖章泽,宋博,袁红春,宋利明,张闪闪.基于深度卷积嵌入式聚类(DCEC)的海洋环境特征提取对渔情预报模型的改进研究--以西南印度洋大眼金枪鱼为例[J].海洋学报,2021,43(8):105-117. 被引量：1
8陶涛,毛伊敏.基于MapReduce和改进人工蜂群算法的并行划分聚类算法[J].科学技术与工程,2021,21(21):8989-8998. 被引量：5
9唐光星,李海洪,刘虎军,范志宏.老旧码头混凝土桩基的牺牲阳极阴极保护方案研究与应用[J].水运工程,2021(9):23-27. 被引量：3
10杨迪,蔡怡然,王鹏,李岩芳.基于改进谱聚类算法的交通区域划分方法[J].计算机工程与设计,2021,42(9):2478-2484. 被引量：5

现代电子技术

2021年第17期

浏览历史

内容加载中请稍等...

通过密度思想和聚类有效性指标改进的K-means算法被引量：9

参考文献14

二级参考文献192

共引文献647

同被引文献73

引证文献9

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

通过密度思想和聚类有效性指标改进的K-means算法 被引量：9

参考文献14

二级参考文献192

共引文献647

同被引文献73

引证文献9

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

通过密度思想和聚类有效性指标改进的K-means算法被引量：9