结合最大最小距离和加权密度的K-means聚类算法被引量：21

K-means Clustering Algorithm Combining Max-Min Distance and Weighted Density

下载PDF

导出

摘要随机选取初始聚类中心和根据经验设置K值对K-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的K-means聚类算法,称为KWDM算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定K值,防止了根据经验来设置K值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。 Both the random selection of initial clustering center and the empirical determination of K value have a certain impact on K-means clustering results.A K-means clustering algorithm based on weighted density and max-min distance is proposed.The clustering center set is selected by using the weighted density method to reduce the impact of outliers on clustering results.Then the center point is selected by the max-min distance to avoid the clustering result falling into local optimum.Finally,the value of K is determined by the ratio of the distance within clusters to the distance between clusters.Experiments show that the improved algorithm not only improves the accuracy of clustering,reduces the average iteration times of the algorithm,but also enhances the stability of the algorithm.

作者马克勤杨延娇秦红武耿琳王丕栋 MA Keqin;YANG Yanjiao;QIN Hongwu;GENG Lin;WANG Pidong(College of Computer Science and Engineering,Northwest Normal University,Lanzhou 730070,China)

机构地区西北师范大学计算机科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2020年第16期50-54,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61662068)。

关键词 K-MEANS 初始中心离群点密度法最大最小距离 K-means initial center outliers density method max-min distance

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1陈小雪,尉永清,任敏,孟媛媛.基于萤火虫优化的加权K-means算法[J].计算机应用研究,2018,35(2):466-470. 被引量：43
2汤深伟,贾瑞玉.基于改进粒子群算法的k均值聚类算法[J].计算机工程与应用,2019,55(18):140-145. 被引量：36
3李艳娟,牛梦婷,李林辉.基于蜂群k-means算法的遥感图像聚类应用研究[J].计算机工程与应用,2019,55(6):151-159. 被引量：20
4杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
5王义武,杨余旺.空间投影在K-means算法中的研究与应用[J].计算机工程与应用,2020,56(7):200-204. 被引量：7
6贾瑞玉,宋建林.基于聚类中心优化的k-means最佳聚类数确定方法[J].微电子学与计算机,2016,33(5):62-66. 被引量：27
7严家萌,庞超逸,许立波.复杂社会网络节点重要性可拓聚类动态分析方法[J].计算机应用与软件,2019,36(7):76-82. 被引量：3
8左进,陈泽茂.基于改进K均值聚类的异常检测算法[J].计算机科学,2016,43(8):258-261. 被引量：51
9张素洁,赵怀慈.最优聚类个数和初始聚类中心点选取算法研究[J].计算机应用研究,2017,34(6):1617-1620. 被引量：82
10王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：111

二级参考文献104

1陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
2李桂林,陈晓云.关于聚类分析中相似度的讨论[J].计算机工程与应用,2004,40(31):64-65. 被引量：26
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
4杨国为,王守觉.模式可拓识别及其神经网络模型[J].哈尔滨工业大学学报,2006,38(7):1129-1132. 被引量：11
5张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：58
6谭跃进,吴俊,邓宏钟.复杂网络中节点重要度评估的节点收缩方法[J].系统工程理论与实践,2006,26(11):79-83. 被引量：258
7袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
8Treshansky A,McGraw R.An overview of clustering algorithms[A].Proceedings of SPIE,The International Society for Optical Engineering[C].2001(4367):41-51.
9Clausi D A.K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture segmentation[J].Pattern Recognition,2002,35:1959-1972.
10Bezdek J C,Pal N R.Some new indexes of cluster validity[J].IEEE Transactions on Systems,Man,and Cybernetics _ Part B:Cybernetics,1998,28(3):301-315.

共引文献550

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145. 被引量：2
2赵栋梁,周晓磊,窦志强,武暕.基于改进FA算法的河流突发水污染事件溯源[J].计算机系统应用,2022,31(10):191-198. 被引量：3
3冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：13
4郭继红,李艳钰.基于RFID的水果包装和自动配送系统研究[J].农机化研究,2020,42(10):251-254. 被引量：3
5刘辉.遥感手段全要素地表分类在国情普查中的应用[J].江西测绘,2021(3):44-47.
6唐辉,刘晓波,韩祥民,邱知,徐邦贤.基于混沌剑鱼算法的K_means算法[J].智能计算机与应用,2022,12(1):69-73.
7段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
8王佳欣,窦小磊.基于Harris角点的快速帧移动多视点图像跟踪识别[J].智能计算机与应用,2021,11(3):22-25. 被引量：2
9刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
10李飞谷,张玉香,朱峰波,温良涛.提高地方煤质数据库应用价值的途径[J].中国科技纵横,2018,0(17):167-168. 被引量：1

同被引文献251

1刘嘉唯,高慧颖,崔立新,朱珈印,吴奕萱.微信社交网络顾客感知服务质量评价指标体系研究[J].信息与管理研究,2019,0(4):58-69. 被引量：5
2李健,曹垚,王宗敏,王广印.融合k-means聚类和Hausdorff距离的散乱点云精简算法[J].武汉大学学报（信息科学版）,2020,45(2):250-257. 被引量：16
3徐泽龙,谷鹏程,赵冰,王莹,侯子文.过氧化氢/紫外线/臭氧氧化技术处理肼类污水的应用[J].南京航空航天大学学报,2019,51(S01):125-132. 被引量：2
4郑梦真,朱朝枝.福建省历史文化型特色小镇发展评价研究——以嵩口镇为例[J].农村经济与科技,2020(13):288-291. 被引量：1
5宋志飞,彭金莲.海南农垦耕地类型的聚类分析[J].计算机应用研究,2020,37(S01):88-91. 被引量：2
6刘胜昔,程春玲.改进的Gabor小波变换特征提取算法[J].计算机应用研究,2020,37(2):606-610. 被引量：25
7李文涛,李梦凯,强志民.化学剂量法原理及其在水处理紫外线技术研究中的应用[J].环境化学,2020,39(2):326-333. 被引量：6
8蒲天骄,乔骥,韩笑,张国宾,王新迎.人工智能技术在电力设备运维检修中的研究及应用[J].高电压技术,2020,46(2):369-383. 被引量：222
9吴世农,黄世忠.企业破产的分析指标和预测模型[J].中国经济问题,1987(6):8-15. 被引量：123
10潘瑜春,刘巧芹,陆洲,周艳兵,李淑华,章永平,李伟.基于农用地分等的区域耕地整理规划[J].农业工程学报,2009,25(S2):260-266. 被引量：33

引证文献21

1郭宗祥.基于属性相似度与聚类的知识服务匹配研究[J].组合机床与自动化加工技术,2020(9):171-174. 被引量：2
2孙鹏,杨杉.基于K-means算法的亚洲足球聚类研究[J].电子技术与软件工程,2020(21):162-163. 被引量：1
3曾如明,李云飞.K-means聚类算法的一种改进方法研究[J].邵阳学院学报（自然科学版）,2021,18(2):8-14. 被引量：7
4张军,宣铁锋,吴磊.基于电网运行数据集的有功网损评估优化[J].现代计算机,2021,27(7):20-23.
5赵国伟,蔡江辉,杨海峰,荀亚玲.一种基于属性加权的快速聚类算法[J].计算机与数字工程,2021,49(5):930-935. 被引量：2
6余姚果,梅亚东,王现勋,朱迪,吴贞晖,张祥.基于改进SBR的风电出力典型场景提取与分析[J].武汉大学学报（工学版）,2021,54(4):346-353. 被引量：4
7曾鸣,姜慧玲.网络群体性事件微博舆情主题演化研究[J].信息与管理研究,2021,6(2):28-40. 被引量：2
8郑芯瑜,刘必林,孔祥洪,王雪辉.基于K-means动态聚类的鸢乌贼角质颚模式识别[J].渔业科学进展,2021,42(4):64-72. 被引量：1
9施天虎,韦诗玥.基于K-means算法的企业信用无监督分类研究[J].电脑知识与技术,2021,17(22):144-145.
10胡金磊,赖俊驹,黎阳羊,杨帆,黄河.基于自适应DBSCAN算法的开关柜绝缘状态评价方法[J].电工技术学报,2021,36(S01):344-352. 被引量：9

二级引证文献94

1陈琳,陈涛.基于LDA模型和信任维度的在线短租用户信任感知空间分布研究——基于Airbnb北京地区数据[J].中国发展,2021,21(5):53-61. 被引量：3
2宋鹏,葛洪伟,乔宇鑫.加权最近邻分配的局部间隙密度聚类[J].南京大学学报（自然科学版）,2022,58(5):827-835. 被引量：2
3卢洪.基于深度学习聚类算法的城市数据分类分级方法[J].工业技术创新,2021,8(4):73-78. 被引量：3
4何军,马稚昱,褚璇,刘洪利,肖天宇,韦鸿钰.基于机器视觉的芒果果形评价方法研究[J].现代农业装备,2021,42(1):56-60. 被引量：5
5杨波,张立娜.基于改进K-means算法的肠道肿瘤图像分析研究[J].电脑与信息技术,2021,29(5):26-28.
6蔡文斌,程晓磊,王鹏,王渊.基于DBSCAN二次聚类的配电网负荷缺失数据修补[J].电气技术,2021,22(12):27-33. 被引量：3
7王代楠,陈琼.改进K-means算法的船舶密集区域识别模型研究与VTS应用[J].中国海事,2022(1):53-56. 被引量：1
8秦梦洁,丁学利,王静.基于因子-聚类分析模型的中药材鉴别[J].阜阳职业技术学院学报,2022,33(1):77-80. 被引量：2
9廉小亲,杨凯,程智博,王万齐,吴艳华.面向建设期铁路大数据的分级存储方法研究[J].铁路计算机应用,2022,31(2):17-22. 被引量：2
10付文华,白竹,张蕾,王世铎.基于IDWPSO-K-means聚类的网约车需求量时变特征分析[J].交通运输研究,2022,8(3):76-84. 被引量：1

1邓玉芳,张继福.一种基于标准差的K-medoids聚类算法[J].计算机技术与发展,2020,30(8):53-60. 被引量：4
2杨文静,张楠,童向荣,杜贞斌.基于特定类的区间值决策系统的分布约简[J].计算机科学,2020,47(3):92-97. 被引量：4
3程万里,张晶,王慧.超密集网络中基于聚类的资源分配方案[J].系统工程与电子技术,2020,42(7):1623-1629. 被引量：9
4牟唯嫣,王春玲,赵昕.基于空间填充准则的交叉验证方法及其应用[J].系统科学与数学,2020,40(2):382-388. 被引量：6
5黎力,闫利,周磊,李东,刘宏清.l_p范数约束的去冲击干扰优化算法[J].西安电子科技大学学报,2020,47(1):30-36. 被引量：2
6毕京鹏,张丽,王萍,李通,杨昊翔,毕森.基于对象及隶属规则的海岸水边线提取方法[J].海岸工程,2019,38(4):247-260.
7金艳,孟婷,支石伟,吴茗蔚,周武杰.基于信号强度的最大似然振幅估计迭代算法[J].浙江科技学院学报,2020,32(3):174-180.
8邵蒙恩,严加勇,崔崤峣,于振坤.基于改进的CV-RSF模型的甲状腺结节超声图像自适应分割算法[J].北京生物医学工程,2020,39(3):251-256. 被引量：4
9李易南,王士同.面向众包数据的特征扩维标签质量提高方法[J].智能系统学报,2020,15(2):227-234.
10张驰,张峰,刘叶楠,赵黎.基于融合聚类的蓝牙指纹室内定位算法优化[J].计算机仿真,2020,37(7):314-318. 被引量：6

计算机工程与应用

2020年第16期

浏览历史

内容加载中请稍等...

结合最大最小距离和加权密度的K-means聚类算法被引量：21

参考文献11

二级参考文献104

共引文献550

同被引文献251

引证文献21

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

结合最大最小距离和加权密度的K-means聚类算法 被引量：21

参考文献11

二级参考文献104

共引文献550

同被引文献251

引证文献21

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

结合最大最小距离和加权密度的K-means聚类算法被引量：21