基于密度二分法的密度峰值聚类方法被引量：4

Density peaks clustering method based on density dichotomy

下载PDF

导出

摘要密度峰值聚类(DPC)方法能够快速地对数据进行聚类,而不管它们的形状和包含它们的空间的维数,近年来得到广泛研究和应用。然而,当各个聚类中心的密度的差异较大,或者同一个类中包含多个密度中心时,DPC计算效果受到影响。针对于此,提出了基于密度二分法的密度峰值聚类方法。首先,求出全部数据平均密度,将数据分为高密度点和低密度点,然后,根据高密度的点的决策图识别出聚类中心后,根据是否存在可达距离的数据点对同类的聚类中心实现合并。最后,根据提出的分配策略,使高密度点和低密度点都分配到合适的聚类中心,从而实现聚类。在多个合成及实际数据集上的实验表明,该方法的聚类效果明显优于已有的DPC方法。 Density Peaks Clustering（DPC）is a famous cluster algorithm for various data, regardless of their shapes or features. It has been widely studied and applied to solve problems in many fields in recent years. However, its clustering effect is reduced when the densities of the cluster centers differ greatly, or there are many peaks of density in a certain cluster. To address it, a density peaks clustering method based on density dichotomies is proposed. Firstly, the global average density of each point is obtained and the data are divided into two groups according to high density and low density.Secondly, it identifies the clustering centers according to the decision diagram of high density points and then merges the clustering centers if it is within reachable distance. Finally, the high density points and the low density points are assigned to the appropriate clustering centers according to the strategy proposed in this paper. Experiments on several synthetic and real datasets show that the clustering results of the proposed algorithm are better than those of existing DPC algorithms.

作者许朝阳林耀海张萍 XU Chaoyang;LIN Yaohai;ZHANG Ping(School of Information Engineering,Putian University,Putian,Fujian 351100,China;College of Computer and Information Sciences,Fujian Agriculture and Forestry University,Fuzhou 350002,China)

机构地区莆田学院信息工程学院福建农林大学计算机与信息学院

出处《计算机工程与应用》 CSCD 北大核心 2018年第12期138-145,共8页 Computer Engineering and Applications

基金莆田市科技局项目(No.2015G2011) 福建省自然科学基金(No.2014J01073) 国家自然科学青年科学基金(No.31300473)

关键词密度峰值聚类密度二分法决策图高密度点 Density Peaks Clustering（DPC） density dichotomy decision diagram high density points

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1李建勋,申静静,李维乾,王婉琳.基于趋势函数的空间数据聚类方法[J].计算机工程与应用,2017,53(6):22-28. 被引量：6
2WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：61
3高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22

二级参考文献35

1杨志恒.基于Ward法的区域空间聚类分析[J].中国人口·资源与环境,2010,20(S1):382-386. 被引量：48
2A. Rodriguez and A. Laio, "Clustering by fast search and find of density peaks", Science, Voi.344, No.6191, pp.1492-1496, 2014.
3United Nations Global Pulse, Big Data for Development: Chal- lenges & Opportunities, http://unglobalpulse.org/, 2012.
4C. Seife, "Big data: The revolution is digitized", Nature, Vol.518, pp.480-481, 2014.
5L. Einav and J. Levin, "Economics in the age of big data", Science, Vol.346, No.6210, pp.715, 2014.
6E.E. Schadt, M.D. Linderman, J. Sorenson, L. Lee and G.P. Nolan, "Computational solutions to large-scale data manage- ment and analysis", Nature Reviews Genetics, Vol.ll, pp.647- 657, 2010.
7S.L. Wang, W.Y. Gan, D.Y. Li and D.R. Li, "Data field for hierarchical clustering", International Journal of Data Ware- housing and Mining, Vol.7, No.2, pp.43-63, 2011.
8A. Rajaraman and J.D. Ullman, Mining of Massive Datasets, Cambridge University Press, London, UK, 2011.
9R. Xu and D. Wunsch, "Survey of clustering algorithms", IEEE Transactions on Neural Networks, Vol.16, No.3, pp.645-678, 2005.
10C.C. Aggarwal and C.K. Reddy, Data Clustering: Algorithms and Applications, CRC Press, New York, USA, 2014.

共引文献78

1陆小莉,刘强,徐生霞.中国产业转型升级的空间分异与影响机制研究[J].经济问题探索,2021(2):135-144. 被引量：3
2李延,王大魁,耿晶,王树良.数据质量聚类算法[J].武汉大学学报（信息科学版）,2019,44(1):153-158. 被引量：3
3WANG Shuliang,LI Qi,YUAN Hanning,GENG Jing,DAI Tianru,DENG Chenwei.Robust Clustering with Topological Graph Partition[J].Chinese Journal of Electronics,2019,28(1):76-84.
4Ziling Pang,Guoyin Wang,Jie Yang.A Multi-granularity Decomposition Mechanism of Complex Tasks Based on Density Peaks[J].Big Data Mining and Analytics,2018,1(3):245-256. 被引量：3
5陶辉.基于密度峰值选取聚类中心的优化[J].内江科技,2016,37(10):31-33. 被引量：1
6魏梦洋,刘力铭,李耀华,王永,王飞.服务于预测评价的风功率出力模式聚类研究[J].电力建设,2017,38(6):108-115.
7杨洁,王国胤,庞紫玲.密度峰值聚类相关问题的研究[J].南京大学学报（自然科学版）,2017,53(4):791-801. 被引量：12
8许家楠,张桂珠.基于数据场的数据势能竞争与K-means融合的聚类算法[J].计算机应用与软件,2017,34(12):266-272. 被引量：2
9陈晓方,钱荧灿,王雅琳,阳春华.基于主元导数特征聚类的加氢裂化动态调整区间识别[J].清华大学学报（自然科学版）,2018,58(1):81-86.
10李晔,陈奕延,张淑芬.基于密度峰值的混合型数据聚类算法设计[J].计算机应用,2018,38(2):483-490. 被引量：6

同被引文献44

1谭跃进,吴俊,邓宏钟.复杂网络中节点重要度评估的节点收缩方法[J].系统工程理论与实践,2006,26(11):79-83. 被引量：257
2金阳,左万利.一种基于动态近邻选择模型的聚类算法[J].计算机学报,2007,30(5):756-762. 被引量：18
3杨黎刚,苏宏业,张英,褚健.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136. 被引量：32
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1060
5张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：61
6朱涛,张水平,郭戎潇,常国岑.改进的加权复杂网络节点重要度评估的收缩方法[J].系统工程与电子技术,2009,31(8):1902-1905. 被引量：78
7田柳,狄增如,姚虹.权重分布对加权网络效率的影响[J].物理学报,2011,60(2):797-802. 被引量：44
8王甲生,吴晓平,廖巍,陈永强.改进的加权复杂网络节点重要度评估方法[J].计算机工程,2012,38(10):74-76. 被引量：44
9吴烨,钟志农,熊伟,陈荦,景宁.一种高效的属性图聚类方法[J].计算机学报,2013,36(8):1704-1713. 被引量：21
10郝飞,陆云,位云成,袁刚,周秋果.大尺寸零件视觉测量中图像拼接技术的研究现状[J].机床与液压,2014,42(14):156-161. 被引量：6

引证文献4

1琚书存,程文杰,徐建鹏,徐祥,徐阳.基于密度峰和划分的快速聚类算法[J].计算机与现代化,2018(8):16-20. 被引量：3
2吴辰文,魏立鑫,刘晓光.一种改进节点凝聚度的密度峰值聚类算法[J].小型微型计算机系统,2020,41(7):1427-1432. 被引量：5
3黄晓,杨炯,张爱梅.基于机器视觉的齿轮图像拼接方法研究[J].机械设计与制造,2021(2):257-261. 被引量：5
4李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1

二级引证文献14

1陈金山.基于密度峰值的电子商务用户行为数据聚类方法[J].哈尔滨师范大学自然科学学报,2023,39(4):65-69.
2段桂芹,邹臣嵩,刘锋.基于优化初始聚类中心的K中心点算法[J].计算机与现代化,2019(4):1-5. 被引量：5
3张苏宁,王月娟,吴水明,景栋盛.基于Krylov子空间方法的网络入侵数据聚类[J].计算机与现代化,2019,0(10):121-126. 被引量：5
4张海燕,李根源,辜建锐,林开荣.基于机器学习的入侵检测技术研究与实现[J].电脑知识与技术,2020,16(10):215-217.
5王芙银,张德生,肖燕婷.基于加权共享近邻与累加序列的密度峰值算法[J].计算机工程,2022,48(4):61-69. 被引量：2
6李纪强,孔令华,花海燕.基于图像拼接的直线轴承长度测量方法[J].电子测量技术,2022,45(8):148-154. 被引量：5
7李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1
8毕超,皮克松,盛波,龙宽,郝雪.基于机器视觉的叶型孔测量技术研究[J].工具技术,2022,56(12):147-151. 被引量：1
9张新元,贠卫国.共享K近邻和多分配策略的密度峰值聚类算法[J].小型微型计算机系统,2023,44(1):75-82. 被引量：1
10李征.半监督全局异构信息保存的网络表示学习[J].计算机应用与软件,2023,40(6):257-265.

1许英,李娟丽.基于密度峰值聚类法的节点重要性研究[J].江西电力职业技术学院学报,2018,31(2):12-13.
2周亚南.非线性代数方程组的一种数值解法[J].应用数学进展,2014,3(2):91-97. 被引量：5
3裴鹿成.蒙特卡罗计算面通量的有界估计方法[J].中国原子能科学研究院年报,1987(1):73-74.
4加华多杰,张海东,熊良林.谈定积分的几种近似计算[J].甘肃科技,2018,34(9):63-64.
5邱保志,唐雅敏.快速识别密度骨架的聚类算法[J].计算机应用,2017,37(12):3482-3486. 被引量：5
6閤静,赵云,黄佳伟,张萍,潘雯,尤安琪,黄希,杨旭,李睿.PM_(2.5)和甲醛联合暴露致小鼠肺损伤及其分子机制的研究[J].生态毒理学报,2018,13(3):87-93. 被引量：2
7杜航原,王文剑,白亮.基于网络节点中心性度量的重叠社区发现算法[J].计算机研究与发展,2018,55(8):1619-1630. 被引量：8
8张彬.条件价值评估法探究[J].现代商贸工业,2018,39(26):95-96. 被引量：1
9赵竑愷.基于成败型数据步加试验的Weibull分布的参数估计[J].统计学与应用,2017,6(3):361-366.
10梁博毅,刘素红.抽样法估算影像植被覆盖度[J].中国水土保持,2018(6):54-58.

计算机工程与应用

2018年第12期

浏览历史

内容加载中请稍等...

基于密度二分法的密度峰值聚类方法被引量：4

参考文献3

二级参考文献35

共引文献78

同被引文献44

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于密度二分法的密度峰值聚类方法 被引量：4

参考文献3

二级参考文献35

共引文献78

同被引文献44

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于密度二分法的密度峰值聚类方法被引量：4