一种基于k近邻的密度峰值聚类算法被引量：1

A Peak Density Clustering Algorithm Based on K-nearest Neighbor

下载PDF

导出

摘要密度峰值聚类算法(DPC算法)虽然具有简单高效的优点,但存在着需要人为确定截断距离的不足,从而造成聚类结果出现不准确。为解决这一问题,本文提出了一种基于K近邻的改进算法。该算法引入信息熵,采用属性加权的距离公式进行聚类,这样就解决了不同属性的权重影响问题;在聚类过程中通过计算数据点的近邻密度,再利用KNN近邻算法实现自动求解截断距离,据此得到聚类中心再进行聚类,通过实验证明,该算法在准确性、运行效率上均有不同程度的提升。 Although DPC algorithm is simple and efficient, it needs to determine the truncation distance manually, which results in inaccurate clustering results. To solve this problem, an improved algorithm based on K-nearest neighbor is proposed. In this algorithm, information entropy is introduced, and attribute weighted distance formula is used to cluster, which solves the problem of weight influence of different attributes. In the process of clustering, the nearest neighbor density of data points is calculated, and then KNN algorithm is used to automatically solve the truncation distance, and then clustering is obtaine.

作者罗军锋锁志海郭倩 LUO Jun-feng;SUO Zhi-hai;GOU Qian(Net&Information center,xi’an jiaotong University,Xi’an 710049,China)

机构地区西安交通大学网络信息中心

出处《软件》 2020年第7期185-188,共4页 Software

关键词聚类密度峰值局部密度聚类中心信息熵 K近邻截断距离相对距离 Clustering Density peak Local density Clustering center Information entropy K-nearest-neighbor Truncation distance Relative distance

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1薛小娜,高淑萍,彭弘铭,吴会会.结合K近邻的改进密度峰值聚类算法[J].计算机工程与应用,2018,54(7):36-43. 被引量：22
2王军华,李建军,李俊山,赖文达.自适应快速搜索密度峰值聚类算法[J].计算机工程与应用,2019,55(24):122-127. 被引量：8
3王洋,张桂珠.自动确定聚类中心的密度峰值算法[J].计算机工程与应用,2018,54(8):137-142. 被引量：35
4赵燕伟,朱芬,桂方志,任设东,谢智伟,徐晨.融合可拓关联函数的密度峰值聚类算法[J].小型微型计算机系统,2019,40(12):2512-2518. 被引量：8
5伏坤,王珣,刘勇,李刚,徐鑫.基于K近邻改进密度峰值聚类分析法的岩体结构面产状优势分组[J].水利水电技术,2019,50(11):124-130. 被引量：6
6贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6
7唐波.改进的K-means聚类算法及应用[J].软件,2012,33(3):100-104. 被引量：9
8丁志成,葛洪伟,周竞.基于KL散度的密度峰值聚类算法[J].重庆邮电大学学报（自然科学版）,2019,31(3):367-374. 被引量：12
9王万良,吴菲,吕闯.自动确定聚类中心的快速搜索和发现密度峰值的聚类算法[J].模式识别与人工智能,2019,32(11):1032-1041. 被引量：14

二级参考文献63

1杨世兴.煤矿监测监控系统的现状与发展[J].安防科技（安全经理人）,2004(5):39-41. 被引量：32
2蔡美峰,王鹏,赵奎,张登科.基于遗传算法的岩体结构面的模糊C均值聚类方法[J].岩石力学与工程学报,2005,24(3):371-376. 被引量：36
3周玉新,周志芳,孙其国.岩体结构面产状的综合模糊聚类分析[J].岩石力学与工程学报,2005,24(13):2283-2287. 被引量：45
4陈雷,王延章.熵权法对融合网络服务质量效率保障研究[J].计算机工程与应用,2005,41(23):1-3. 被引量：3
5高琰,谷士文,唐琎,蔡自兴.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203. 被引量：31
6李明华,刘全,刘忠,郗连霞.数据挖掘中聚类算法的新发展[J].计算机应用研究,2008,25(1):13-17. 被引量：49
7谭颖,胡瑞飞,殷国富.多密度阈值的DBSCAN改进算法[J].计算机应用,2008,28(3):745-748. 被引量：16
8雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：112
9杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
10薄华,马缚龙,焦李成.基于免疫K-means聚类的无监督SAR图像分割[J].模式识别与人工智能,2008,21(3):376-380. 被引量：2

共引文献100

1刘盛,吴辰,杨浩楠,段奥,呼延明,李国强.基于SLP方法和层次分析法的刀具车间布置优化[J].工业技术创新,2021,8(3):147-152.
2滑江,孙钰,周彦斌,蔡曙日,龚尚文.基于K-means方法的气象数据分区在公路养护的应用[J].公路交通科技,2022,39(S01):19-23.
3全球片式电容器面面观(之一)[J].世界产品与技术,2000(1):42-43. 被引量：2
4罗军锋,洪丹丹.基于数据抽样的自动k-means聚类算法[J].现代电子技术,2014,37(8):19-21. 被引量：4
5张莉曼,张向先,卢恒,张玲.知识直播平台付费用户群体画像研究[J].图书情报工作,2019,63(5):84-91. 被引量：20
6叶菁,黄庆佳.一种基于内核级监测的恶意软件聚类分析方法[J].软件,2017,38(5):1-6.
7李睿,刘同飞.卫星图像传输跟踪优化识别方法仿真研究[J].计算机仿真,2017,34(9):30-33. 被引量：4
8于玲玲,独家卿,陈龙.改进的K-均值算法在商业客户识别中的应用研究[J].通化师范学院学报,2017,38(10):75-77. 被引量：2
9周世波,徐维祥.密度峰值快速搜索与聚类算法及其在船舶位置数据分析中的应用[J].仪器仪表学报,2018,39(7):152-163. 被引量：10
10周世波,徐维祥.一种基于相对密度和决策图的聚类算法[J].控制与决策,2018,33(11):1921-1930. 被引量：8

同被引文献16

1冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量：85
2谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：101
3蒋礼青,张明新,郑金龙,戴娇,尚赵伟.快速搜索与发现密度峰值聚类算法的优化研究[J].计算机应用研究,2016,33(11):3251-3254. 被引量：31
4淦文燕,刘冲.一种改进的搜索密度峰值的聚类算法[J].智能系统学报,2017,12(2):229-236. 被引量：14
5Chun-xue WANG,Li-gang LIU.Feature matching using quasi-conformal maps[J].Frontiers of Information Technology & Electronic Engineering,2017,18(5):644-657. 被引量：4
6王星,呙鹏程,王玉冰,程越.基于线性回归分析的快速搜索聚类中心算法[J].系统工程与电子技术,2017,39(11):2614-2622. 被引量：4
7刘奕志,程汝峰,梁永全.一种基于共享近邻的密度峰值聚类算法[J].计算机科学,2018,45(2):125-129. 被引量：4
8朱红,何瀚志,方谦昊,代岳.基于改进密度峰值聚类的医学图像分割[J].徐州医科大学学报,2018,38(10):652-658. 被引量：3
9薛小娜,高淑萍,彭弘铭,吴会会.结合K近邻的改进密度峰值聚类算法[J].计算机工程与应用,2018,54(7):36-43. 被引量：22
10王洋,张桂珠.自动确定聚类中心的密度峰值算法[J].计算机工程与应用,2018,54(8):137-142. 被引量：35

引证文献1

1葛丽娜,陈园园,周永权.密度峰值聚类算法研究现状与分析[J].广西科学,2022,29(2):277-286. 被引量：1

二级引证文献1

1李登辉,葛丽娜,王哲,樊景威,张壕.DCVAE与DPC融合的网络入侵检测模型研究[J].小型微型计算机系统,2024,45(4):998-1006.

1Carmen.酩言[J].葡萄酒,2020(7):12-12.
2池萌,杨瑞,刘继伟,刘欢.新型冠状病毒肺炎的多层螺旋CT表现及动态观察[J].医学影像学杂志,2020,30(7):1182-1185. 被引量：3
3塔娜.基于云计算技术的大规模数据聚类分析[J].现代电子技术,2020,43(15):123-126. 被引量：4
4周芸,杜景林,陶晔.基于属性加权k最近邻算法的降雨预测[J].计算机工程与设计,2020,41(6):1605-1609. 被引量：6
5马小龙,余强,刘建蓓,马媛媛.基于无人机视频拍摄的高速公路小型车换道行为特性[J].中国公路学报,2020,33(6):95-105. 被引量：20
6姚红娟,王海.基于优化的克隆选择算法的灾害判别[J].国外电子测量技术,2020,39(5):28-33.
7高一鹭,胡志华.基于时空网络的自动化集装箱码头自动化导引车路径规划[J].计算机应用,2020,40(7):2155-2163. 被引量：7
8张勇,张建伟,韩云祥.一种改进的航迹聚类方法[J].现代计算机,2020,26(18):11-18. 被引量：1
9李文龙,成巍,马庆增,王文涛,戈海龙,何建群.基于图像处理技术的轮毂智能检测系统[J].激光杂志,2020,41(7):58-62. 被引量：4
10王江锋,刘雨桐,王梦玉,闫学东.车车通信环境下基于驾驶意图共享的车辆避撞预警算法[J].中国公路学报,2020,33(6):65-76. 被引量：12

软件

2020年第7期

浏览历史

内容加载中请稍等...

一种基于k近邻的密度峰值聚类算法被引量：1

参考文献9

二级参考文献63

共引文献100

同被引文献16

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于k近邻的密度峰值聚类算法 被引量：1

参考文献9

二级参考文献63

共引文献100

同被引文献16

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于k近邻的密度峰值聚类算法被引量：1