基于密度峰和划分的快速聚类算法被引量：3

A Fast Clustering Algorithm Based on Cluster-centers and Partition

下载PDF

导出

摘要传统基于划分的聚类算法需要人工给定聚类数,且由于算法采取刚性划分,可能会导致将较大或延伸状的聚类簇分割的现象,导致错误的聚类结果。密度峰聚类是近年提出的一种新的基于密度的聚类算法,该算法不需要预先指定聚类数目,且能够发现非球形簇。将密度峰思想引入基于划分的聚类算法,提出一种基于密度峰和划分的快速聚类算法(DDBSCAN),该算法首先获取一组簇的核心对象(密度峰),用于描述簇的"骨骼",而后将周围的点划分到最近的核心对象,最后通过判断划分边界处的密度情况合并簇。实验证明,该算法能有效地适应任意形状、大小不一的数据集,与传统基于密度的聚类算法相比收敛速度更快。 The clustering algorithm based on traditional partition needs to give the number of clustering artificially,and due to the rigid partition of the algorithm,it may lead to the segmentation of large or extended clusters,leading to the wrong clustering results. Clustering by density peak is a new clustering algorithm based on density proposed in recent years. The algorithm does not need to specify the number of clusters in advance,and can detect nonspherical clusters. A fast clustering algorithm based on density peak and partition（DDBSCAN） is proposed in this paper. The algorithm first obtains the cluster center（density peak） of a group of clusters,which describes the＂skeleton＂of the cluster,then divides the surrounding points into the nearest core object,and finally the clusters is merged by judging the density at the dividing edge. Experiments show that the algorithm can effectively adapt to data sets of arbitrary shape and size,and converges faster than traditional clustering algorithms based on density.

作者琚书存程文杰徐建鹏徐祥徐阳 JU Shu-cun;CHENG Wen-jie;XU Jian-peng;XU Xiang;XU Yang(Rural Comprehensive Economic Information Center of Anhui Province,Hefei 230001,China;Anhui Agrometeorological Center,Hefei 230001,China)

机构地区安徽省农村综合经济信息中心安徽省农业气象中心

出处《计算机与现代化》 2018年第8期16-20,共5页 Computer and Modernization

基金国家科技支撑计划项目(2014BAD10B05-02) 国家星火计划项目(2014GA710001) 安徽省科技攻关项目(1804A07020124)

关键词密度峰聚类核心对象基于划分边界密度任意形状 clustering by density peak cluster center partition-based boundary density irregular shape

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1060
2李涛,葛洪伟,苏树智.基于密度自适应距离的密度峰聚类[J].小型微型计算机系统,2017,38(6):1347-1352. 被引量：6
3郑河荣,陈恳,潘翔.结合代表点和密度峰的增量动态聚类算法[J].浙江工业大学学报,2017,45(4):427-433. 被引量：6
4陈朝威,常冬霞.基于密度差分的自动聚类算法[J].软件学报,2018,29(4):935-944. 被引量：16
5王岩,彭涛,韩佳育,刘露.一种基于密度的分布式聚类方法[J].软件学报,2017,28(11):2836-2850. 被引量：13
6李涛,葛洪伟,苏树智.自动确定聚类中心的密度峰聚类[J].计算机科学与探索,2016,10(11):1614-1622. 被引量：12
7吴烨,钟志农,熊伟,陈荦,景宁.一种高效的属性图聚类方法[J].计算机学报,2013,36(8):1704-1713. 被引量：21
8金阳,左万利.一种基于动态近邻选择模型的聚类算法[J].计算机学报,2007,30(5):756-762. 被引量：18
9许朝阳,林耀海,张萍.基于密度二分法的密度峰值聚类方法[J].计算机工程与应用,2018,54(12):138-145. 被引量：4
10马福民,逯瑞强,张腾飞.基于局部密度自适应度量的粗糙K-means聚类算法[J].计算机工程与科学,2018,40(1):184-190. 被引量：15

二级参考文献58

1黄永平,邹力鹍.数据仓库中基于密度的批量增量聚类算法[J].计算机工程与应用,2004,40(29):206-208. 被引量：9
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
3Dubes R C, Jain A K. Algorithms for Clustering Data. Englewood Cliffs, NJ: Prentice Hall, 1988.
4Zhang Tian, Ramakrishnan Raghu, Livny Miron. Birch: An efficient data clustering method for very large databases// Proceedings of the ACM SIGMOD Conference on Management of Data. Montreal, Canada, 1996: 103-114.
5Guha S, Rastogi R, Shim K. ROCK:A robust clustering algorithm for categorical attributes//Proceedings of the 15th International Conference on Data Engineering. Sydney, Australia, 1999:1-11.
6Gupta G K, Ghosh J. Value balanced agglomerative connectivity clustering//Proceedings of the SPIE Conference on Data Mining and Knowledge Discovery Ⅲ. Orlando, USA, 2001:6-15.
7Dutta M, Kakoti Mahanta A, Pujari Arun K. QROCK: A quick version of the ROCK algorithm for clustering of categorical data. Pattern Recognition Letters, 2005, 26(15): 2364-2373.
8Gehrke J. New research directions in KDD. Report on the SIGKDD 2001 Conference Panel, SIGKDD Explorations,2002, 3(2): 76-77.
9Steinbach M, Karypis G, Kumar V. A comparison of document clustering techniques. Minnesota: University of Minnesota, Technical Report: 00-034, 2002.
10Sebastiani F. A tutorial on automatic text categorization// Proceedings of the 1st Argentinean Symposium on Artificial Intelligence (ASAI'99). Buenos Aires, AR, 1999:7-35.

共引文献1157

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献29

1张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
2贺英杰,叶宗民,金吉学.机器学习在入侵检测中的应用综述[J].计算机安全,2010(3):20-21. 被引量：2
3张新有,曾华燊,贾磊.入侵检测数据集KDD CUP99研究[J].计算机工程与设计,2010,31(22):4809-4812. 被引量：119
4熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：86
5谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：31
6朱文杰,王强,翟献军.基于信息熵的SVM入侵检测技术[J].计算机工程与科学,2013,35(6):47-51. 被引量：5
7刘春.基于组合算法选择特征的网络入侵检测模型[J].计算机与现代化,2014(8):75-80. 被引量：20
8钱燕燕,李永忠,余西亚.基于多标记与半监督学习的入侵检测方法研究[J].计算机科学,2015,42(2):134-136. 被引量：14
9杨昆朋.基于深度信念网络的入侵检测模型[J].现代计算机（中旬刊）,2015(1):10-14. 被引量：13
10卞彩峰,邱建林,陈燕云,陆鹏程,陈璐璐.基于粒计算的k值选取及其应用[J].计算机工程与设计,2015,36(11):3082-3086. 被引量：4

引证文献3

1段桂芹,邹臣嵩,刘锋.基于优化初始聚类中心的K中心点算法[J].计算机与现代化,2019(4):1-5. 被引量：5
2张苏宁,王月娟,吴水明,景栋盛.基于Krylov子空间方法的网络入侵数据聚类[J].计算机与现代化,2019,0(10):121-126. 被引量：5
3张海燕,李根源,辜建锐,林开荣.基于机器学习的入侵检测技术研究与实现[J].电脑知识与技术,2020,16(10):215-217.

二级引证文献10

1胡翔.基于改进差分进化算法的网络空间入侵检测研究[J].周口师范学院学报,2020,37(5):53-56. 被引量：1
2刘锋,邹臣嵩,崔炜.大数据环境下基于K中心点优化算法的Web服务组合[J].计算机与现代化,2020(12):20-24. 被引量：1
3陆妍玲,韦晶闪,赵雨萌,周俊芬,李景文,姜建武.提取热点区域的时空轨迹数据聚类分析[J].数学的实践与认识,2021,51(13):129-138. 被引量：3
4张战胜,马亮.基于弹性搜索的网络入侵数据防御控制系统[J].现代电子技术,2021,44(23):57-61. 被引量：2
5吴水明,吉志远,王震宇,景栋盛.基于Dueling-DDQN的电力信息网络入侵检测算法[J].计算机与现代化,2021(12):43-47. 被引量：7
6陈默.基于遗传算法的网络信息安全过滤系统设计[J].信息与电脑,2022,34(1):62-64. 被引量：3
7段桂芹,邹臣嵩.基于近邻传播聚类的职业能力评价模型[J].计算机与现代化,2022(5):21-27.
8田云娜,赵彦霖,刘雪,赵彭丽,韩小颖.仿生聚类算法研究与分析[J].延安大学学报（自然科学版）,2022,41(2):11-21.
9刘威,于玲,王畅巍,邓文韬,邓中民.基于EM算法的高斯混合模型的织物组织点自动识别[J].现代纺织技术,2024,32(2):63-69.
10胡玉琴,朱博逸.基于聚类算法的网络信息安全检测与跟踪系统研究[J].信息与电脑,2024,36(3):96-98.

1王鹏飞,杨余旺,柯亚琪.密度峰值快速聚类算法优化研究[J].计算机工程与科学,2018,40(8):1503-1510. 被引量：3
2李永攀,刘正江,蔡垚,郑中义.基于AIS数据约束聚类的海上交通特征分析[J].船海工程,2018,47(1):176-179. 被引量：8
3徐健锐,詹永照.基于Spark的改进K-means快速聚类算法[J].江苏大学学报（自然科学版）,2018,39(3):316-323. 被引量：16
4王亚飞,杨卫东,徐振强.基于出租车轨迹的载客热点挖掘[J].信息与电脑,2017,29(16):141-143.
5王洋,张桂珠.自动确定聚类中心的密度峰值算法[J].计算机工程与应用,2018,54(8):137-142. 被引量：35
6董树霞,邵增珍,李丽娟,车统统.基于WSN的二维入侵监测区域可变k覆盖优化算法及仿真[J].建模与仿真,2017,6(2):124-132. 被引量：1
7刘思佳.一树长青一树新[J].湖南教育（D版）,2018,0(2):61-61.
8包蕴,左忠义,殷巍,牛帅,邹德龙.电动汽车充电站选址规划研究[J].长春师范大学学报,2018,37(8):46-50. 被引量：2
9于四全,毕建涛.空间点模式聚类方法研究[J].科技创新与生产力,2018(4):49-52. 被引量：1
10程国建,宋博敬.FCM聚类算法在岩石图像分析中的应用[J].智能计算机与应用,2018,8(4):78-80.

计算机与现代化

2018年第8期

浏览历史

内容加载中请稍等...

基于密度峰和划分的快速聚类算法被引量：3

参考文献12

二级参考文献58

共引文献1157

同被引文献29

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于密度峰和划分的快速聚类算法 被引量：3

参考文献12

二级参考文献58

共引文献1157

同被引文献29

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于密度峰和划分的快速聚类算法被引量：3