基于距离和密度的d-K-means算法被引量：12

d-K-means algorithm based on distance and density

下载PDF

导出

摘要针对K-means算法对初始聚类中心和噪声敏感的缺点,提出了d-K-means算法(distance&density),在K-means算法的基础上权衡了密度和距离对聚类的影响,对数据进行加权处理,在权值基础上引入最小最大原则选择初始聚类中心,自动确定类中心个数。实验结果表明,d-K-means算法在低维与高维数据上都可以取得较好的聚类效果,并且可以更好地应对低密度区域数据,更好地进行类中心选择。 To deal with the disadvantages of the K-means algorithm that is sensitive to initial clustering center and noise,this paper proposed the d-K-means algorithm. On the basis of the K-means algorithm,it weighed the data considering the impact of density and distance on clustering. It selected the initial clustering center by introducing the min-max principle on the basis of weight,and automatically determined the number of class centers. Experimental results show that d-K-means algorithm can achieve better clustering results on low-dimensional data sets and high-dimensional data sets,and better deal with low-density regional data,and better select class centers.

作者唐泽坤朱泽宇杨裔李彩虹李廉 Tang Zekun;Zhu Zeyu;Yang Yi;Li Caihong;Li Lian(College of Information Science&Engineering,Lanzhou University,Lanzhou 730000,China)

机构地区兰州大学信息科学与工程学院

出处《计算机应用研究》 CSCD 北大核心 2020年第6期1719-1723,共5页 Application Research of Computers

基金国家重点研发计划资助项目(2018YFB1003205) 国家自然科学基金资助项目(61300230,61370219) 甘肃省自然科学基金资助项目(1107RJZA188) 甘肃省科技支撑计划资助项目(1104GKCA037) 甘肃省科技重大专项项目(1102FKDA010)。

关键词聚类 K-MEANS算法最小最大原则类中心个数 clustering K-means algorithm min-max principle number of class centers

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1翟东海,鱼江,高飞,于磊,丁锋.最大距离法选取初始簇中心的K-means文本聚类算法的研究[J].计算机应用研究,2014,31(3):713-715. 被引量：108
2汤荣志,段会川,孙海涛.SVM训练数据归一化研究[J].山东师范大学学报（自然科学版）,2016,31(4):60-65. 被引量：58
3张亚洲,余正生.基于k-means++聚类的视频摘要生成算法[J].工业控制计算机,2017,30(7):129-130. 被引量：4
4蔡龙飞.运用硬c均值改进kmeans算法的聚类分析[J].科技咨询导报,2007(24):144-145. 被引量：4
5贾瑞玉,宋建林.基于聚类中心优化的k-means最佳聚类数确定方法[J].微电子学与计算机,2016,33(5):62-66. 被引量：27
6周炜奔,石跃祥.基于密度的K-means聚类中心选取的优化算法[J].计算机应用研究,2012,29(5):1726-1728. 被引量：48
7冯振华,钱雪忠,赵娜娜.Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法[J].计算机应用研究,2016,33(9):2693-2696. 被引量：45
8唐东凯,王红梅,胡明,刘钢.优化初始聚类中心的改进K-means算法[J].小型微型计算机系统,2018,39(8):1819-1823. 被引量：33
9王法胜,鲁明羽,赵清杰,袁泽剑.粒子滤波算法[J].计算机学报,2014,37(8):1679-1694. 被引量：189
10毛典辉.基于MapReduce的Canopy-Kmeans改进算法[J].计算机工程与应用,2012,48(27):22-26. 被引量：65

二级参考文献92

1郭庆琳,吴克河,吴慧芳,李存斌.基于文本聚类的多文档自动文摘研究[J].计算机研究与发展,2007,44(z2):140-144. 被引量：5
2郭珉.模糊聚类分析算法的MATLAB语言实现[J].农业网络信息,2004(5):44-45. 被引量：14
3杨海岳.模糊聚类分析在农业经济中的应用及编程处理方法[J].河北建筑工程学院学报,2004,22(3):103-106. 被引量：2
4李峰,刘顺利,熊平,黄福卷.基于改进C-均值聚类算法的空中目标分类[J].现代防御技术,2004,32(6):10-13. 被引量：6
5袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
6刘远超,王晓龙,刘秉权.一种改进的k-means文档聚类初值选择算法[J].高技术通讯,2006,16(1):11-15. 被引量：23
7杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
8刘远超,王晓龙,徐志明,关毅.文档聚类综述[J].中文信息学报,2006,20(3):55-62. 被引量：65
9赵世奇,刘挺,李生.一种基于主题的文本聚类方法[J].中文信息学报,2007,21(2):58-62. 被引量：23
10李良群,姬红兵,罗军辉.迭代扩展卡尔曼粒子滤波器[J].西安电子科技大学学报,2007,34(2):233-238. 被引量：60

共引文献610

1李小波,刘威,李健.基于模糊聚类分析方法的高含水期油藏层系优化[J].当代化工,2019,0(11):2630-2633. 被引量：2
2沈桂莹,李国栋,李珊珊.基于人工神经网络对侧堰流量系数的预测研究[J].水动力学研究与进展（A辑）,2022,37(1):125-131. 被引量：2
3杨然,王虹,孙传波,余国才.基于因子图优化的DBSCAN聚类组合导航算法[J].微波学报,2023,39(S01):409-413.
4郭继红,李艳钰.基于RFID的水果包装和自动配送系统研究[J].农机化研究,2020,42(10):251-254. 被引量：3
5赵麒瑞,韩耀斌,沈惠,刘光花.上升段飞行器目标的视频图像跟踪[J].南京航空航天大学学报,2019,51(S01):68-72. 被引量：2
6李曼,杨茂林,刘长岳,何仙利,段雍.基于图像的煤矸分选中图像照度调节方法[J].煤炭学报,2021,46(S02):1149-1158. 被引量：6
7薛潇.船舶水下通信系统中海声信道文本数据聚类方法研究[J].舰船科学技术,2019,0(20):115-117.
8侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10邹超,杨国平.基于孪生卷积神经网络的目标跟踪算法研究[J].智能计算机与应用,2021,11(3):177-180.

同被引文献119

1陈杰,牛聪,李勇,黄饶,陈力鑫,马泽川.基于数据驱动紧框架理论的三维地震数据去噪与重建[J].石油地球物理勘探,2020(4):725-732. 被引量：5
2杜佳颖,段隆振,段文影,卜秋瑾.基于Spark的改进K-means算法的并行实现[J].计算机应用研究,2020,37(2):434-436. 被引量：12
3任江涛,施潇潇,孙婧昊,黄焕宇,印鉴.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学,2006,33(7):186-187. 被引量：10
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
5杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
6谢娟英,蒋帅,王春霞,张琰,谢维信.一种改进的全局K-均值聚类算法[J].陕西师范大学学报（自然科学版）,2010,38(2):18-22. 被引量：47
7周世兵,徐振源,唐旭清.新的K-均值算法最佳聚类数确定方法[J].计算机工程与应用,2010,46(16):27-31. 被引量：90
8陈慧.学生评教数据的科学化处理研究[J].文教资料,2011(14):170-171. 被引量：2
9吴夙慧,成颖,郑彦宁,潘云涛.K-means算法研究综述[J].现代图书情报技术,2011(5):28-35. 被引量：166
10邹小婷,刘波.高校学生评教现状调查[J].教育学术月刊,2011(6):53-56. 被引量：28

引证文献12

1杨红,李丹宁,王雅洁.基于离群点检测(LOF)的K-means算法[J].通信技术,2019,52(8):1884-1888. 被引量：7
2徐义鎏,贺鹏,任东,王慧,董婷,邵攀.基于改进faster RCNN的木材运输车辆检测[J].计算机应用,2020,40(S01):209-214. 被引量：7
3苑迎春,雒明雪,陈江薇.基于机器学习的高校学生评教信度分类分析[J].河北农业大学学报（社会科学版）,2021,23(3):127-132. 被引量：1
4马钰,莫路锋.通过密度思想和聚类有效性指标改进的K-means算法[J].现代电子技术,2021,44(17):120-123. 被引量：9
5杨勇,陈强,曲福恒,刘俊杰,张磊.基于模拟划分的SP-k-means-+算法[J].吉林大学学报（工学版）,2021,51(5):1808-1816. 被引量：3
6雒明雪,苑迎春,陈江薇,王克俭.基于邻域密度的K-means初始聚类中心优选方法[J].重庆理工大学学报（自然科学）,2021,35(10):180-186. 被引量：3
7沈郭鑫,蒋中云.基于密度和中心指标的Canopy二分K-均值算法优化[J].计算机工程与科学,2022,44(2):372-380. 被引量：6
8康厚良,杨玉婷.东巴象形文字文档图像的文本行自动分割算法研究[J].图学学报,2022,43(5):865-874.
9曾宏志,史洪松.面向光通信网络系统的异常入侵在线检测研究[J].激光杂志,2022,43(12):139-143. 被引量：4
10薛峪峰,马晓琴,罗红郊,田光欣.海量冗余数据冲击下网络入侵检测方法[J].电子设计工程,2023,31(22):167-170.

二级引证文献40

1任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
2许新鑫,徐兵,彭潜.基于时空域联合分析的海缆温度异常监测[J].船舶工程,2023,45(S01):67-70. 被引量：1
3许沥文,王默玉,申晓留.基于标签体系的高校学生立体画像研究[J].长江信息通信,2021(3):155-158.
4肖健夫,孙瑞,闵婕,黄娟,马洋洋.锂离子动力电池系统故障检测[J].电源技术,2021,45(6):736-739. 被引量：11
5周华平,王京,孙克雷.改进的YOLOv4⁃tiny行人检测算法研究[J].无线电通信技术,2021,47(4):474-480. 被引量：10
6富立琪,王华倩,乔学工.基于k-means分簇和灰狼优化的无线传感网络路由算法[J].电子设计工程,2021,29(23):1-6. 被引量：9
7曾怡苗.基于环形数据集的改进K-means聚类算法[J].软件,2021,42(11):74-76. 被引量：1
8陈学仕,苏通,漆为民.基于改进Faster RCNN的印刷电路板瑕疵检测算法[J].江汉大学学报（自然科学版）,2022,50(1):87-96. 被引量：4
9张欣妍,董四辉,张紫慧,郭相仪.基于LOF改进的K-means算法在交通事故黑点识别中的应用[J].黑龙江交通科技,2022,45(1):134-136. 被引量：1
10王彦雅.基于Two-Stage的目标检测算法综述[J].河北省科学院学报,2022,39(2):14-22. 被引量：6

1靳雁霞,齐欣,张晋瑞,程琦甫.一种改进的简化均值粒子群K-means聚类算法[J].微电子学与计算机,2020,37(5):69-74. 被引量：11
2陈兴志,王代文,刘乃瑶,乐文涛,黄飞翔.基于PSO-KMeans快速图像分割算法模型的应用[J].现代信息科技,2020,4(5):79-81. 被引量：1
3陈峻婷.一种基于最大相关熵准则的核极限学习机[J].赣南师范大学学报,2019,40(6):30-34.
4符保龙.基于改进PSO优化FCM的入侵检测模型[J].柳州职业技术学院学报,2020,0(1):106-109. 被引量：1

计算机应用研究

2020年第6期

浏览历史

内容加载中请稍等...

基于距离和密度的d-K-means算法被引量：12

参考文献12

二级参考文献92

共引文献610

同被引文献119

引证文献12

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于距离和密度的d-K-means算法 被引量：12

参考文献12

二级参考文献92

共引文献610

同被引文献119

引证文献12

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于距离和密度的d-K-means算法被引量：12