K近邻相似度优化的密度峰聚类被引量：8

Density Peaks Clustering Optimized by K Nearest Neighbor's Similarity

下载PDF

导出

摘要针对密度峰聚类分配时,仅考虑样本点与指向点(密度比它大的最近点)之间的距离,不适用于流形聚类(如Circleblock数据集、Lineblobs数据集等)的问题,提出了K近邻相似度优化的密度峰聚类算法。在计算每个点的密度与指向点后,通过相似度函数,找出每个点的K近邻,然后根据K近邻信息判断样本点的指向点是否正确,对于指向错误的点重新寻找正确的指向点,可以有效减少错误分配。在人工数据集和UCI数据集上的实验表明,新算法具有更高的准确率。 For the clustering of density peaks, only the distance between the sample point and the point of pointing(the nearest point of density is bigger than it)is considered, and it is not applicable to the problem of manifold clustering(such as Circleblock data set, Lineblobs data set, etc.). A density peak clustering algorithm with K similarity optimization is proposed. After calculating the density and point of each point, find the K neighborhood of each point by the similarity function, and then judge whether the point of the sample point is correct according to the K proximity information.For the point pointing to the wrong point, it can effectively reduce the error distribution. Experiments on artificial datasets and UCI datasets show that the new algorithm has a higher accuracy rate.

作者朱庆峰葛洪伟 ZHU Qingfeng;GE Hongwei(Ministry of Education Key Laboratory of Advanced Process Control for Light Industry(Jiangnan University),Wuxi,Jiangsu 214122,China;School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区轻工过程先进控制教育部重点实验室(江南大学) 江南大学物联网工程学院

出处《计算机工程与应用》 CSCD 北大核心 2019年第2期148-153,252,共7页 Computer Engineering and Applications

关键词聚类密度峰相似度 K近邻 clustering density peaks similarity K nearest neighbor

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1马春来,单洪,马涛.一种基于簇中心点自动选择策略的密度峰值聚类算法[J].计算机科学,2016,43(7):255-258. 被引量：47
2谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
3杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
4欧慧,夏卓群,武志伟.基于改进流形距离的粗糙集k-means聚类算法[J].计算机工程与应用,2016,52(14):84-89. 被引量：4

二级参考文献56

1李洁,高新波,焦李成.一种基于修正划分模糊度的聚类有效性函数[J].系统工程与电子技术,2005,27(4):723-726. 被引量：8
2张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
3普运伟,金炜东,朱明,胡来招.核模糊C均值算法的聚类有效性研究[J].计算机科学,2007,34(2):207-210. 被引量：28
4王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
5HALKIDI M, VAZIRGIANNIS M, BATISTAKIS Y. Quality scheme assessment in the clustering process [ C ]//Proc of the 4th Eur Conf Principles and Practice of Knowledge Discovery in Databases. 2000: 165-276.
6THEODORIDIS S, KOUTROUBAS K. Pattern recognition[ M]. [S.l. ] :Academic Press, 1999.
7HALKIDI M, BATISTAKIS Y, VAZIRGIANNIS M. On clustering validation techniques [ J ]. Intelligent Information Systems, 2001, 17 (2-3) :107-145.
8HALKIDI M, VAZIRGIANNIS M. Clustering validity assessment using multi representatives[ C]//Proc of SETN Conference. 2002.
9YANG Yan, KAMEL M, JIN Fan. A model of document clustering using ant colony algorithm and validity index [ C ]//Proc of IEEE International Joint Conference on Neural Networks. Montreal: [ s. n. ], 2005 : 2730- 2735.
10RESSOM H, WANG D, NATARAJAN P. Adaptive double self-organizing maps for clustering gene expression profiles [ J ]. Neural Networks ,2003,16(5-6) :633-640.

共引文献255

1夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
2何灵敏,潘益民.一种基于GA的聚类集成算法[J].中国计量学院学报,2011,22(3):282-285. 被引量：2
3谢凤英,秦世引,姜志国,孟如松.皮肤镜黑素细胞瘤图像自适应聚类的进化寻优[J].计算机辅助设计与图形学学报,2009,21(12):1745-1752. 被引量：2
4王超,刘涛,杜利平,杨桢,班晓娟,周贤伟.一种新的认知无线电主用户信号识别方法[J].电波科学学报,2009,24(6):1119-1123. 被引量：12
5刘春晓,张翠芳.基于SOM和PSO的聚类组合算法[J].通信技术,2010,43(1):208-209. 被引量：7
6刘志勇,邓贵仕.一种基于矩阵变换的层次聚类算法[J].郑州大学学报（理学版）,2010,42(2):39-42. 被引量：6
7廉琪,苏屹.基于SOM和PSO聚类组合算法的客户细分研究[J].华东经济管理,2011,25(1):118-121. 被引量：2
8谭维,杨燕.基于自组织特征映射的聚类集成算法[J].计算机工程与设计,2010,31(22):4885-4888. 被引量：4
9施蓓琦,刘春,陈能,林文鹏.典型地物实测光谱的相似性测度与实验分析[J].同济大学学报（自然科学版）,2011,39(2):292-298. 被引量：6
10刘燕驰.基于密度的最佳聚类数确定方法[J].中国管理信息化,2011,14(9):30-33. 被引量：4

同被引文献65

1曹可劲,赵宗贵,江汉.不确定性证据聚类问题讨论[J].信息与控制,2006,35(1):55-58. 被引量：3
2孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
3袁英,陈立潮,任姚鹏,王秀慧.结合引力的模糊C-值聚类算法研究[J].计算机应用与软件,2010,27(8):271-272. 被引量：2
4贾修一,商琳.一种求三支决策阈值的模拟退火算法[J].小型微型计算机系统,2013,34(11):2603-2606. 被引量：17
5刘盾,李天瑞,李华雄.粗糙集理论:基于三支决策视角[J].南京大学学报（自然科学版）,2013,49(5):574-581. 被引量：46
6王卫卫,李小平,冯象初,王斯琪.稀疏子空间聚类综述[J].自动化学报,2015,41(8):1373-1384. 被引量：79
7谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
8柯小路,马荔瑶,李子懿,王永.证据推理规则的性质研究及方法修正[J].信息与控制,2016,45(2):165-170. 被引量：10
9刘展杰,陈晓云.局部子空间聚类[J].自动化学报,2016,42(8):1238-1247. 被引量：14
10苗夺谦,张清华,钱宇华,梁吉业,王国胤,吴伟志,高阳,商琳,顾沈明,张红云.从人类智能到机器实现模型——粒计算理论与方法[J].智能系统学报,2016,11(6):743-757. 被引量：62

引证文献8

1高月,杨小飞,马盈仓,汪义瑞.基于共享k-近邻与共享逆近邻的密度峰聚类[J].计算机工程与应用,2019,55(20):43-51. 被引量：5
2朱恒东,马盈仓,杨婷,张要.基于ε-邻域和拉普拉斯矩阵秩约束的谱聚类算法[J].纺织高校基础科学学报,2020,33(1):88-94. 被引量：6
3覃华,刘政,苏一丹.基于最优密度估计的密度峰值聚类算法[J].计算机工程与设计,2020,41(7):1877-1883. 被引量：2
4周欢欢,郑伯川,张征,张琦.基于自适应近邻参数的密度峰聚类算法[J].计算机应用,2022,42(5):1464-1471. 被引量：1
5汪康,马宗方,田鸿朋,宋琳.不确定数据信任密度峰值聚类算法[J].信息与控制,2022,51(3):349-360. 被引量：1
6赵力衡,王建,陈虹君.去中心化加权簇归并的密度峰值聚类算法[J].计算机科学与探索,2022,16(8):1910-1922. 被引量：3
7李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1
8罗舒文,万仁霞,苗夺谦.基于簇中心预选策略的三支决策密度峰值聚类算法[J].山西大学学报（自然科学版）,2024,47(1):30-39.

二级引证文献19

1高月,杨小飞,马盈仓,汪义瑞.基于共享逆近邻与指数核的密度峰聚类算法[J].纺织高校基础科学学报,2020,33(2):78-84.
2张要,马盈仓,杨小飞,朱恒东,杨婷.基于L_(2,1)-范数距离的约束相似矩阵的聚类算法[J].计算机工程与设计,2021,42(3):726-733. 被引量：2
3冀将,孟立凡.基于双目视觉的障碍物识别研究[J].电子设计工程,2021,29(6):60-64. 被引量：4
4周波.基于多层次注意力机制的交通节点分类[J].广东交通职业技术学院学报,2021,20(1):42-46.
5汪俭华,陈守维.基于仿射传播聚类算法的大数据并行化分析研究[J].电子设计工程,2021,29(13):20-23. 被引量：4
6周欢欢,张征,张琦.结合共享近邻和共享逆近邻的密度峰聚类[J].西华师范大学学报（自然科学版）,2022,43(1):108-115. 被引量：1
7叶楠,寇丽杰.构建基于密度峰值聚类算法的反作弊系统[J].数字通信世界,2022(5):46-48. 被引量：1
8朱恒东,马盈仓,刘自强,安小卫.基于局部线性约束和成对约束信息的半监督稀疏子空间聚类[J].宝鸡文理学院学报（自然科学版）,2022,42(2):23-29.
9李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1
10潘文标,元文浩.基于密度划分的云数据分块存储方法仿真[J].计算机仿真,2022,39(8):456-459. 被引量：2

1王全民,杨晶,张帅帅.一种基于改进果蝇优化的K-mediods聚类算法[J].计算机技术与发展,2018,28(12):17-22. 被引量：6
2宋薇,仇楠楠,沈林勇,章亚男.面向工业零件的机器人单目立体匹配与抓取[J].机器人,2018,40(6):950-957. 被引量：13
3韩英波,蒋凯歌,张倩玉.Hadamard流形中子流形的p-调和函数的刘维尔型定理[J].信阳师范学院学报（自然科学版）,2019,32(1):11-16. 被引量：1
4戴天辰,顾正弘.基于传递距离的谱聚类算法[J].计算机与现代化,2018(12):61-66. 被引量：1
5于晓飞,葛洪伟.噪声环境下复杂流形数据的势能层次聚类算法[J].重庆邮电大学学报（自然科学版）,2018,30(6):848-854. 被引量：3
6Jürgen Jost,李先清,陈群.调和映照及其推广[J].中国科学：数学,2019,49(2):125-138.
7肖宁聪,袁凯,王永山.基于序列代理模型的结构可靠性分析方法[J].电子科技大学学报,2019,48(1):156-160. 被引量：2
8赵小强,刘晓丽.基于密度敏感的改进自适应谱聚类算法[J].兰州理工大学学报,2018,44(6):102-106. 被引量：3
9陈志超,张智超,罗旋,叶龙珍.基于隐患点详查及非线性叠加算法的地质灾害风险区划[J].灾害学,2019,34(1):94-98. 被引量：3
10林强,唐加山.一种适用于混合型分类数据的聚类算法[J].计算机工程与应用,2019,55(1):168-173. 被引量：5

计算机工程与应用

2019年第2期

浏览历史

内容加载中请稍等...

K近邻相似度优化的密度峰聚类被引量：8

参考文献4

二级参考文献56

共引文献255

同被引文献65

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

K近邻相似度优化的密度峰聚类 被引量：8

参考文献4

二级参考文献56

共引文献255

同被引文献65

引证文献8

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

K近邻相似度优化的密度峰聚类被引量：8