自适应聚类中心策略优化的密度峰值聚类算法被引量：1

Density Peak Clustering Algorithm Optimized by Adaptive Clustering Centers Strategy

下载PDF

导出

摘要密度峰值聚类算法(DPC)是一种简单高效的无监督聚类算法,能够快速找到聚类中心完成聚类。该算法通过截断距离定义局部密度未考虑样本点的空间分布特征;通过决策图选择聚类中心点,具有较强人为主观性;在分配样本点时采用单一分配策略,易产生连带错误。因此提出一种自适应聚类中心策略优化的密度峰值聚类算法(ADPC),采用共享近邻定义两点之间的相似性度量,重新定义了局部密度,使局部密度反应样本间的空间分布特征;通过相邻点之间斜率差分确定样本密度ρ与相对距离δ的乘积γ值的“拐点”,并对γ进行幂函数变换,以提高潜在聚类中心与非聚类中心的区分度,利用决策函数确定潜在的聚类中心,再通过潜在聚类中心之间距离均值自适应确定真实聚类中心;优化了非聚类中心点的分配策略。通过在UCI以及人工数据集上进行实验,该算法都可以自适应准确选定聚类中心,且在一定程度上提高了聚类性能。 Density peak clustering(DPC)algorithm is a simple and efficient unsupervised clustering algorithm,which can quickly find the clustering centers to complete clustering.However,the local density is defined by truncation distance without considering the spatial distribution characteristics of sample points.Selecting clustering center points by decision graph has strong artificial subjectivity.When using single allocation strategy,it is easy to cause joint error.Therefore,a density peak clustering algorithm optimized by shared nearest neighbors and adaptive clustering centers strategy(ADPC)is proposed.The shared nearest neighbors are used to define the similarity measure between two points,and the local density is redefined so that it reflects the spatial distribution characteristics of samples.Theγvalue is the product of the sample densityρand relative distanceδ.The“inflection point”is determined by slope difference between adjacent points.And theγpower transformation improves the degree of differentiation between the potential clustering centers and the non-clustering centers.Decision function is used to determine the potential clustering centers.Then,the mean of distance between the potential clustering centers adaptive to determine the real clustering centers.The allocation strategy of non-clustering center points is optimized.Through experiments on UCI and synthetic datasets,the algorithm can select the clustering centers adaptively and improve the clustering performance to some extent.

作者徐童童解滨张喜梅张春昊 XU Tongtong;XIE Bin;ZHANG Ximei;ZHANG Chunhao(College of Computer and Cyber Security,Hebei Normal University,Shijiazhuang 050024,China;Hebei Provincial Key Laboratory of Network and Information Security,Hebei Normal University,Shijiazhuang 050024,China;Hebei Provincial Engineering Research Center for Supply Chain Big Data Analytics and Data Security,Hebei Normal University,Shijiazhuang 050024,China)

机构地区河北师范大学计算机与网络空间安全学院河北师范大学河北省网络与信息安全重点实验室河北师范大学供应链大数据分析与数据安全河北省工程研究中心

出处《计算机工程与应用》 CSCD 北大核心 2023年第21期91-101,共11页 Computer Engineering and Applications

基金国家自然科学基金(62076088) 河北师范大学技术创新基金(L2020K09)。

关键词密度峰值聚类共享近邻斜率差分自适应决策函数 density peak clustering shared neighbors slope difference adaptive decision function

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：21
2丁世飞,徐晓,王艳茹.基于不相似性度量优化的密度峰值聚类算法[J].软件学报,2020,31(11):3321-3333. 被引量：30
3谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
4李涛,葛洪伟,苏树智.自动确定聚类中心的密度峰聚类[J].计算机科学与探索,2016,10(11):1614-1622. 被引量：12
5王万良,吴菲,吕闯.自动确定聚类中心的快速搜索和发现密度峰值的聚类算法[J].模式识别与人工智能,2019,32(11):1032-1041. 被引量：15
6张新元,贠卫国.共享K近邻和多分配策略的密度峰值聚类算法[J].小型微型计算机系统,2023,44(1):75-82. 被引量：5

二级参考文献48

1余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
2淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：83
3Han J W, Kamber M. Data Mining Concepts and Techniques. 2nd ed. New York:Elsevier Inc, 2006. 383-424.
4Jain A K. Data clustering:50 years beyond K-means. Pattern Recogn Lett, 2010, 31:651-666.
5Williamson B, Guyon I. Clustering:science or art?. J Mach Learn Res, 2012, 27:65-80.
6Frey B J, Dueck D. Clustering by passing messages between data points. Science, 2007, 315:972-976.
7Rodri?uez A, Laio A. Clustering by fast search and find of density peaks. Science, 2014, 344:1492-1496.
8Xu R, Wunsch D. Survey of clustering algorithms. IEEE Trans Neural Netw Learn Syst, 2005, 16:645-678.
9McQueen J. Some methods for classification and analysis of multivariate observations. In:Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. Los Angeles:University of California, 1967. 281-297.
10Likas A, Vlassis N, Verbeek J J. The global K-means clustering algorithm. Pattern Recogn, 2003, 36:451-464.

共引文献175

1刘友超,张曦煌.基于自然最近邻相似图的谱聚类[J].计算机应用研究,2020,37(1):30-33. 被引量：7
2夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
3杨磊,吴涛.一种常用的二维任意域的Delaunay三角剖分算法的健壮性补充[J].中国图象图形学报（A辑）,2000,5(4):323-326. 被引量：4
4许芳芳.一种结合蚁群聚类算法的DBSCAN算法[J].池州学院学报,2014,28(6):33-36. 被引量：2
5凌朝东,陈虎,杨骁,张浩,黄信.结合SLIC超像素和DBSCAN聚类的眼底图像硬性渗出检测方法[J].华侨大学学报（自然科学版）,2015,36(4):399-405. 被引量：8
6张霓,陈天天,何熊熊.基于数据场和单次划分的聚类算法[J].浙江工业大学学报,2016,44(1):52-57. 被引量：9
7贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6
8罗嗣卿,刘璐.改进K-means算法对大兴安岭蓝莓干销售预测的应用[J].黑龙江大学自然科学学报,2017,34(2):139-144. 被引量：2
9李兴宇,毕硕本,李栋梁,赵显富.1616—1911年河南省异常洪涝灾害的时空特征及其成因[J].气象科学,2017,37(3):348-358. 被引量：6
10程汝峰,刘奕志,梁永全.基于互近邻相对距离的最小生成树聚类算法[J].郑州大学学报（理学版）,2017,49(3):20-27. 被引量：2

同被引文献7

1马春来,单洪,马涛.一种基于簇中心点自动选择策略的密度峰值聚类算法[J].计算机科学,2016,43(7):255-258. 被引量：47
2王万良,吴菲,吕闯.自动确定聚类中心的快速搜索和发现密度峰值的聚类算法[J].模式识别与人工智能,2019,32(11):1032-1041. 被引量：15
3丁世飞,徐晓,王艳茹.基于不相似性度量优化的密度峰值聚类算法[J].软件学报,2020,31(11):3321-3333. 被引量：30
4Panthadeep BHATTACHARJEE,Pinaki MITRA.A survey of density based clustering algorithms[J].Frontiers of Computer Science,2021,15(1):139-165. 被引量：7
5章曼,张正军,冯俊淇,严涛.基于自适应可达距离的密度峰值聚类算法[J].计算机应用,2022,42(6):1914-1921. 被引量：6
6吴润秀,尹士豪,赵嘉,李沛武,刘宝宏.基于相对密度估计和多簇合并的密度峰值聚类算法[J].控制与决策,2023,38(4):1047-1055. 被引量：8
7位雅,张正军,何凯琳,唐莉.基于相对密度的密度峰值聚类算法[J].计算机工程,2023,49(6):53-61. 被引量：3

引证文献1

1刘天娇,王胜景,袁永生.基于类簇合并的无参数密度峰值聚类算法[J].现代电子技术,2024,47(8):1-8.

1唐欣.优化的K-means聚类算法在客户细分中的应用研究[J].智能计算机与应用,2023,13(9):194-196. 被引量：3
2无.吉林:“两找一服务”树强人社品牌[J].中国人力资源社会保障,2023(8):29-30.
3余豪东,陈玉明,吴克寿,韩锋钢.决策粒K均值聚类算法[J].闽南师范大学学报（自然科学版）,2023,36(3):1-13. 被引量：1
4刘辉,刘鑫满,刘大东.面向复杂道路目标检测的YOLOv5算法优化研究[J].计算机工程与应用,2023,59(18):207-217. 被引量：4
5田恒屹,肖洪兵,计亚荣,Rahman Md Mostafizur.基于三维UNet与混合焦点损失函数的脑肿瘤全自动分割算法[J].中国医学物理学杂志,2023,40(9):1114-1120.
6沈雅婷,白郁馨.卷积网络结构优化的人脸识别算法[J].电脑与电信,2023(6):9-13.
7马焕焕.桉柠蒎肠溶软胶囊加糠酸莫米松治疗慢性鼻炎的疗效分析[J].中国医学文摘（耳鼻咽喉科学）,2023,38(5):115-118. 被引量：1
8胡淼.基于“AI识谣”技术的微博谣言治理研究[J].新闻研究导刊,2023,14(15):102-104.
9栾传彬,吕健,黄业凌,李琦,邹永宁.航空发动机精密零件的CT图像增强算法[J].无损检测,2023,45(4):7-12.
10谷菁芳,严力,凌人.基于AI识别的自动扶梯安全运行监控系统设计[J].自动化技术与应用,2023,42(9):131-134.

计算机工程与应用

2023年第21期

浏览历史

内容加载中请稍等...

自适应聚类中心策略优化的密度峰值聚类算法被引量：1

参考文献6

二级参考文献48

共引文献175

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

自适应聚类中心策略优化的密度峰值聚类算法 被引量：1

参考文献6

二级参考文献48

共引文献175

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

自适应聚类中心策略优化的密度峰值聚类算法被引量：1