基于相互K近邻的密度峰值聚类算法

Density Peaks Clustering Algorithm Based on Mutual K-Nearest Neighbor

下载PDF

导出

摘要密度峰值聚类是一种原理简单、运行高效的聚类算法,但其存在密度定义方式不统一、聚类中心选择容易出错和样本分配可能产生“多米诺”现象等问题。针对上述问题,提出一种基于相互K近邻的密度峰值聚类算法(MKDPC)。首先,基于样本的相互K近邻定义一种改进的局部密度,统一了DPC算法密度定义方式,能够有效避免变密度数据集聚类中心选择出错的问题;其次,基于相互K近邻定义了样本间的共享相互K近邻和相似度,进而提出一种样本多步分配策略,该策略可以有效克服样本分配过程中的“多米诺”现象。在人工数据集和真实数据集上进行实验,并将MKDPC算法与其他4种算法进行比较,验证了所提MKDPC算法的有效性。 Density peaks clustering,a kind of clustering algorithm with simple principle and high efficiency,faces several challenges,such as disunity in density definition,easy error in cluster centers selection and“domino”phenomenon in sample allocation.To solve these problems,a density peaks clustering algorithm based on mutual K-nearest neighbor(MKDPC)is proposed.Firstly,an improved density is defined based on the mutual K-nearest neighbor of samples,which unifies the density definition method of DPC algorithm,and can effectively avoid the problem of cluster centers selection error of variable density datasets.Secondly,the shared mutual K-nearest neighbor and similarity between samples are defined based on mutual Knearest neighbor,and then a multi-step sample allocation strategy is proposed,which can effectively overcome the“domino”phenomenon in the process of sample allocation.Experiments are carried out on synthetic datasets and real datasets,and the MKDPC algorithm is compared with other four alternative methods,with results substantiating its efficacy.

作者赵志忠陈素根 ZHAO Zhizhong;CHEN Sugen(School of Mathematics and Physics,Anqing Normal University,Anqing 246133,China)

机构地区安庆师范大学数理学院

出处《安庆师范大学学报（自然科学版）》 2024年第2期41-46,共6页 Journal of Anqing Normal University(Natural Science Edition)

基金国家自然科学基金项目(61702012) 安徽省自然科学基金项目(2008085MF193) 安徽省高校自然科学研究重点项目(2022AH051053)。

关键词密度峰值聚类相互K近邻局部密度分配策略 density peaks clustering mutual K-nearest neighbor local density allocation strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1王一宾,黄志强,程玉胜.基于K-means的GLOCAL改进算法[J].安庆师范大学学报（自然科学版）,2020,26(2):55-62. 被引量：1
2王威娜,朱钰,任艳.融合相对密度和最近邻关系的密度峰值聚类[J].计算机科学与探索,2023,17(8):1879-1892. 被引量：1
3陈磊,吴润秀,李沛武,赵嘉.加权K近邻和多簇合并的密度峰值聚类算法[J].计算机科学与探索,2022,16(9):2163-2176. 被引量：9

二级参考文献12

1程玉胜,赵大卫,钱坤.近邻标签空间非平衡化标签补全的多标签学习[J].模式识别与人工智能,2018,31(8):740-749. 被引量：4
2高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
3薛小娜,高淑萍,彭弘铭,吴会会.结合K近邻的改进密度峰值聚类算法[J].计算机工程与应用,2018,54(7):36-43. 被引量：22
4纪霞,姚晟,赵鹏.相对邻域与剪枝策略优化的密度峰值聚类算法[J].自动化学报,2020,46(3):562-575. 被引量：15
5贾露,张德生,吕端端.物理学优化的密度峰值聚类算法[J].计算机工程与应用,2020,56(13):47-53. 被引量：14
6丁世飞,徐晓,王艳茹.基于不相似性度量优化的密度峰值聚类算法[J].软件学报,2020,31(11):3321-3333. 被引量：29
7王芙银,张德生,张晓.结合鲸鱼优化算法的自适应密度峰值聚类算法[J].计算机工程与应用,2021,57(3):94-102. 被引量：20
8彭启慧,宣士斌,高卿.分布的自动阈值密度峰值聚类算法[J].计算机工程与应用,2021,57(5):71-78. 被引量：5
9赵嘉,姚占峰,吕莉,樊棠怀.基于相互邻近度的密度峰值聚类算法[J].控制与决策,2021,36(3):543-552. 被引量：24
10徐金东,赵甜雨,冯国政,欧世峰.基于上下文模糊C均值聚类的图像分割算法[J].电子与信息学报,2021,43(7):2079-2086. 被引量：20

共引文献8

1路太宇,李晓会,张馨予,吕维新,邓倩.社交网络中一种基于偏好的隐私度量方法研究[J].辽宁工业大学学报（自然科学版）,2022,42(6):393-398.
2杨鸿潭.基于伪标签增强的多视角模糊聚类[J].信息与电脑,2023,35(8):120-123.
3盛锦超,杜明晶,孙嘉睿,李宇蕊.面向Shapelet空间的多变量时间序列密度聚类算法[J].计算机科学与探索,2024,18(2):387-402. 被引量：1
4史曼曼,宋朝炀,张景祥.融合优化可调Q因子小波变换的改进密度峰值聚类算法[J].计算机应用研究,2024,41(2):466-472. 被引量：1
5吕莉,陈威,肖人彬,韩龙哲,谭德坤.面向密度分布不均数据的加权逆近邻密度峰值聚类算法[J].智能系统学报,2024,19(1):165-175.
6王旭,陈东升.基于多维时间序列的预处理方法[J].科技与创新,2024(8):121-123.
7朱鸿祥,吴根秀,王兆辉.基于共享邻近度和概率分配的密度峰值聚类算法[J].计算机工程与应用,2024,60(12):74-90.
8赵雅楠,尹娜,司志好,尚文婧,冯振兴.乳腺癌空间转录组数据集上基于深度学习的EnST算法研究[J].内蒙古工业大学学报（自然科学版）,2024,43(3):200-205.

1王红霞,赵丽.基于AKD-means算法对轨迹数据的聚类研究[J].信息技术与信息化,2023(5):111-114.
2王蕊,黎晓琴,张丽娇.肠息肉患者发病影响因素病例对照研究[J].华南预防医学,2024,50(3):255-258.
3韩延岳.在力做功定义中引入数量积的教学思考[J].数理化学习（教研版）,2024(2):3-4.
4秦明星,王忠,李海龙,刘鑫.基于分布式模型预测的无人机编队避障控制[J].北京航空航天大学学报,2024,50(6):1969-1981. 被引量：1
5周玉,夏浩,岳学震,王培崇.基于改进K-means的局部离群点检测方法[J].工程科学与技术,2024,56(4):66-77.
6侯立,王健.改进密度峰值聚类的多源数据异常值检测算法[J].计算机仿真,2024,41(6):565-569.

安庆师范大学学报（自然科学版）

2024年第2期

浏览历史

内容加载中请稍等...

基于相互K近邻的密度峰值聚类算法

参考文献3

二级参考文献12

共引文献8

相关作者

相关机构

相关主题

浏览历史