基于共享逆近邻与指数核的密度峰聚类算法

Density peak clustering algorithm based on shared reverse nearest neighbors and exponential kernels

下载PDF

导出

摘要针对密度峰聚类算法中局部密度定义和聚类分配策略的不足,提出了一种基于共享逆近邻与指数核的密度峰聚类算法。该算法利用样本的共享逆近邻点和指数核函数构造一种相似度,得到一种新的密度并将其应用在密度峰聚类算法中生成初始簇,然后将这些簇与凝聚层次聚类算法结合形成最终的类簇。数值实验证明:提出的基于共享逆近邻与指数核的密度峰聚类算法在真实数据集上的聚类结果要优于其他密度聚类算法,并能有效解决密度峰聚类算法中局部密度定义问题和聚类分配策略问题。 For the deficiency of local density definition and cluster allocation strategy in the density peak clustering algorithm,a density peak clustering algorithm based on shared reverse nearest neighbors and exponential kernels is proposed.The proposed algorithm defines the similarity based on shared reverse nearest neighbors of the sample combined with the exponential kernel function,and then a new density is formed and applied in the density clustering algorithm to generate the initial clusters,which are combined with the agglomeration hierarchical clustering algorithm to form the final cluster.The numerical experiments show that the clustering results of the proposed algorithm on real datasets are better than other density clustering algorithms,and it effectively solves the problem of local density definition and cluster allocation strategy in density peak clustering algorithm.

作者高月杨小飞马盈仓汪义瑞 GAO Yue;YANG Xiaofei;MA Yingcang;WANG Yirui(School of Science,Xi’an Polytechnic University,Xi’an 710048,China;School of Mathematics&Statistics,Ankang University,Ankang 725000,Shaanxi,China)

机构地区西安工程大学理学院安康学院数学与统计学院

出处《纺织高校基础科学学报》 CAS 2020年第2期78-84,共7页 Basic Sciences Journal of Textile Universities

基金国家自然科学基金(11501435)。

关键词密度峰聚类算法共享逆近邻指数核相似度凝聚层次聚类算法 density peak clustering algorithm shared reverse nearest neighbor exponential kernel similarity agglomerative hierarchical clustering algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1张超,赵向阳.基于加权模糊核聚类的局部放电模式识别[J].电力电子,2012(1):32-35. 被引量：3
2周晨曦,梁循,齐金山.基于约束动态更新的半监督层次聚类算法[J].自动化学报,2015,41(7):1253-1263. 被引量：20
3刘静,黄玉清.结合SCoW的改进FLICM医学图像分割研究[J].计算机应用研究,2018,35(6):1887-1890. 被引量：2
4高月,杨小飞,马盈仓,汪义瑞.基于共享k-近邻与共享逆近邻的密度峰聚类[J].计算机工程与应用,2019,55(20):43-51. 被引量：5
5谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104

二级参考文献43

1Mika, S.; Ratsch, G.; Weston, J.; Scholkopf, B.; Mullets, K.R. Fisher discriminant analysis with kernels[J], Neural Networks for Signal Processing IX, 1999. Proceedings of the 1999 IEEE Signal Processing Society Workshop ,1999:41-48.
2Scholkopf, B.; Mika, S.; Burges, C.J.C.; Knirsch, P.; Muller, K.-R.; Ratsch, G.; Smola, A.J.; Input space versus feature space in kernel-based methods [J], Neural Networks, IEEE Transactions,1999,10(5):1000-1017.
3Muller, K.-R.; Mika, S.; Ratsch, G.; Tsuda, K.; Scholkopf, B.; An introduction to kernel-based learning algorithms[J], Neural Networks, IEEE Transactions,2001,12(2): 181-201.
4谈克雄,李福祺.基于距离的放电模式识别方法[J].高压电器,1997,33(3):3-7. 被引量：7
5Han J W, Kamber M. Data Mining Concepts and Techniques. 2nd ed. New York:Elsevier Inc, 2006. 383-424.
6Jain A K. Data clustering:50 years beyond K-means. Pattern Recogn Lett, 2010, 31:651-666.
7Williamson B, Guyon I. Clustering:science or art?. J Mach Learn Res, 2012, 27:65-80.
8Frey B J, Dueck D. Clustering by passing messages between data points. Science, 2007, 315:972-976.
9Rodri?uez A, Laio A. Clustering by fast search and find of density peaks. Science, 2014, 344:1492-1496.
10Xu R, Wunsch D. Survey of clustering algorithms. IEEE Trans Neural Netw Learn Syst, 2005, 16:645-678.

共引文献129

1夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
2杨磊,吴涛.一种常用的二维任意域的Delaunay三角剖分算法的健壮性补充[J].中国图象图形学报（A辑）,2000,5(4):323-326. 被引量：4
3李晓庆,唐昊,司加胜,苗刚中.面向混合属性数据集的改进半监督FCM聚类方法[J].自动化学报,2018,44(12):2259-2268. 被引量：8
4于福华,范永青.基于改进FCM算法的交通流分析[J].西安邮电大学学报,2016,21(2):115-118. 被引量：1
5褚睿鸿,王红军,杨燕,李天瑞.基于密度峰值的聚类集成[J].自动化学报,2016,42(9):1401-1412. 被引量：15
6刘凯.基于实测数据的局部放电在线巡检故障诊断[J].上海电力,2016,29(4):32-36.
7殷文辉.基于动态演化聚类算法的E-Learning培训搜索研究[J].电子设计工程,2016,24(22):90-93. 被引量：1
8王敏,耿照江,茅鑫同.考虑可再生能源出力与负荷相关性的发电系统可靠性分析[J].陕西电力,2017,45(2):26-30. 被引量：8
9贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6
10罗嗣卿,刘璐.改进K-means算法对大兴安岭蓝莓干销售预测的应用[J].黑龙江大学自然科学学报,2017,34(2):139-144. 被引量：2

1吕健,王震,潘伟杰,赵慧亮,刘征宏.基于层次聚类的定制产品模块划分方法研究[J].组合机床与自动化加工技术,2019(11):134-138. 被引量：10
2顾清华,李俊飞,卢才武.基于AHCP算法的大规模露天矿生产计划问题求解[J].重庆大学学报（自然科学版）,2020,43(4):33-46. 被引量：2
3石泽,张赟宁.含有分布式光伏的配电网分区及主导节点的选择[J].电工材料,2020,0(1):37-40. 被引量：4
4冯海霞,陈建军,邓建榕,赵永恒.CCD图像中宇宙线μ子甄选技术[J].天文研究与技术,2020,17(2):201-209. 被引量：4
5李志南,刘玮,韩丽娟,殷思强.基于二维LiDAR的轨道侵入异物检测系统与方法研究[J].光电子．激光,2020,31(3):262-268. 被引量：3
6李文斌,何冉.基于深度神经网络的遥感图像飞机目标检测[J].计算机工程,2020,46(7):268-276. 被引量：13
7刘凯,龚兰兰,凌兴宏,周家骎.改进聚类算法在公交数据挖掘中的应用研究[J].计算机技术与发展,2020,30(6):207-210. 被引量：3
8赵欣然,郝山山,石宇佳.国家储备粮库温度场分布模型研究[J].中国粮油学报,2019,34(S02):57-63. 被引量：2
9段黎明,涂玉林,李中明,罗雪清,任华桥.基于密度的进化算法的机械产品选配方法[J].计算机集成制造系统,2020,26(2):312-319. 被引量：4
10樊凤杰,轩凤来,白洋,纪会芳.基于三维荧光光谱特征的中药药性模式识别研究[J].光谱学与光谱分析,2020,40(6):1763-1768. 被引量：15

纺织高校基础科学学报

2020年第2期

浏览历史

内容加载中请稍等...

基于共享逆近邻与指数核的密度峰聚类算法

参考文献5

二级参考文献43

共引文献129

相关作者

相关机构

相关主题

浏览历史