Ball-Tree优化的密度峰值聚类算法被引量：3

Density Peak Clustering Algorithm Based on Ball-Tree

下载PDF

导出

摘要针对密度峰值聚类算法DPC(clustering by fast search and find of density peaks)时间复杂度高、准确度低的缺陷,提出了一种基于Ball-Tree优化的快速密度峰值聚类算法BT-DPC。算法利用第k近邻度量样本局部密度,通过构建Ball-Tree加速密度ρ及距离δ的计算;在类簇分配阶段,结合k近邻思想设计统计学习分配策略,将边界点正确归类。通过在UCI数据集上的实验,将该算法与原密度峰值聚类算法及其改进算法进行了对比,实验结果表明,BT-DPC算法在降低时间复杂度的同时提高了聚类的准确度。 In order to overcome the deficiencies of clustering by fast search and find of density peaks(DPC)for its high time complexity and low accuracy,an optimized fast density peak clustering algorithm is proposed based on Ball-Tree in this paper(BT-DPC).The algorithm defines local density of a point based on k-nearest neighbor,and constructs a ball tree to accelerate the calculation of the local densityρand the distanceδ.In the cluster allocation stage,the statistical learning allocation strategy is designed based on the k-nearest neighbors idea to classify the boundary points correctly.The experimental result shows that the BT-DPC algorithm can improve the time performance on the basis of increasing clustering quality compared with DPC algorithm and other popular clustering algorithms through the theory analysis and the experiments on several real-world datasets from the UCI machine learning repository.

作者丁松阳田青云 DING Songyang;TIAN Qingyun(School of Computer and Information Engineering,Henan University of Economics and Law,Zhengzhou 450046,China)

机构地区河南财经政法大学计算机与信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第20期90-96,共7页 Computer Engineering and Applications

基金国家自然科学基金(61202285)。

关键词聚类算法 ball-tree 密度峰值聚类分配策略 clustering algorithm ball-tree clustering by fast search and find of density peaks(DPC) allocation strategy

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：103
2纪霞,姚晟,赵鹏.相对邻域与剪枝策略优化的密度峰值聚类算法[J].自动化学报,2020,46(3):562-575. 被引量：14
3贾露,张德生,吕端端.物理学优化的密度峰值聚类算法[J].计算机工程与应用,2020,56(13):47-53. 被引量：14
4杜沛,程晓荣.一种基于K近邻的比较密度峰值聚类算法[J].计算机工程与应用,2019,55(10):161-168. 被引量：12

二级参考文献37

1Han J W, Kamber M. Data Mining Concepts and Techniques. 2nd ed. New York:Elsevier Inc, 2006. 383-424.
2Jain A K. Data clustering:50 years beyond K-means. Pattern Recogn Lett, 2010, 31:651-666.
3Williamson B, Guyon I. Clustering:science or art?. J Mach Learn Res, 2012, 27:65-80.
4Frey B J, Dueck D. Clustering by passing messages between data points. Science, 2007, 315:972-976.
5Rodri?uez A, Laio A. Clustering by fast search and find of density peaks. Science, 2014, 344:1492-1496.
6Xu R, Wunsch D. Survey of clustering algorithms. IEEE Trans Neural Netw Learn Syst, 2005, 16:645-678.
7McQueen J. Some methods for classification and analysis of multivariate observations. In:Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability. Los Angeles:University of California, 1967. 281-297.
8Likas A, Vlassis N, Verbeek J J. The global K-means clustering algorithm. Pattern Recogn, 2003, 36:451-464.
9Xie J Y, Jiang S, Xie W, et al. An efficient global K-means clustering algorithm. J Comput, 2011, 6:271-279.
10Ester M, Kriegel H P, Sander J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise. In:Proceedings of ACM SIGKDD'96, Portland, 1996. 226-231.

共引文献132

1夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：15
2杨磊,吴涛.一种常用的二维任意域的Delaunay三角剖分算法的健壮性补充[J].中国图象图形学报（A辑）,2000,5(4):323-326. 被引量：4
3贾培灵,樊建聪,彭延军.一种基于簇边界的密度峰值点快速搜索聚类算法[J].南京大学学报（自然科学版）,2017,53(2):368-377. 被引量：6
4罗嗣卿,刘璐.改进K-means算法对大兴安岭蓝莓干销售预测的应用[J].黑龙江大学自然科学学报,2017,34(2):139-144. 被引量：2
5程汝峰,刘奕志,梁永全.基于互近邻相对距离的最小生成树聚类算法[J].郑州大学学报（理学版）,2017,49(3):20-27. 被引量：2
6杨洁,王国胤,庞紫玲.密度峰值聚类相关问题的研究[J].南京大学学报（自然科学版）,2017,53(4):791-801. 被引量：12
7张宜,谢娟英,李静,陈媛媛,贺瑞瑞,李燕.红斑鳞状皮肤病的聚类分析[J].济南大学学报（自然科学版）,2017,31(3):181-187. 被引量：4
8王星,呙鹏程,王玉冰,程越.基于线性回归分析的快速搜索聚类中心算法[J].系统工程与电子技术,2017,39(11):2614-2622. 被引量：4
9王博,吴智群.电站风机故障智能预警技术的应用研究[J].热能动力工程,2017,32(10):66-70. 被引量：6
10钟能,杨文,杨祥立,郭威.基于混合Wishart模型的极化SAR图像非监督分类[J].雷达学报（中英文）,2017,6(5):533-540. 被引量：9

同被引文献30

1廖庆斌,李舜酩,覃小攀.车辆振动信号的特征提取方法比较[J].吉林大学学报（工学版）,2007,37(4):910-914. 被引量：9
2刘闯,花向红,赵杰,王中华.基于小波去噪的高铁沉降预测模型研究[J].测绘地理信息,2015,40(1):37-40. 被引量：21
3薛卫星,邱卫宁,花向红,吴帮,蔡建民.RSSI信号特征值对WiFi室内定位精度的影响分析[J].测绘地理信息,2016,41(4):23-26. 被引量：16
4许朝阳,林耀海,张萍.基于密度二分法的密度峰值聚类方法[J].计算机工程与应用,2018,54(12):138-145. 被引量：4
5高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
6王洋,张桂珠.自动确定聚类中心的密度峰值算法[J].计算机工程与应用,2018,54(8):137-142. 被引量：35
7王林,徐兴敏,张智欢,付欣.复杂网络理论在彩色图像分割中的应用研究[J].计算机测量与控制,2018,26(7):246-250. 被引量：3
8朱庆峰,葛洪伟.K近邻相似度优化的密度峰聚类[J].计算机工程与应用,2019,55(2):148-153. 被引量：8
9纪霞,张涛,朱建磊,刘诗诚,李学俊.近邻密度分布优化样本分配的改进DPC聚类算法[J].华南理工大学学报（自然科学版）,2019,47(2):98-105. 被引量：3
10李明,王盛,孙更新,宾晟.基于稀疏光流和密度聚类的运动目标检测算法[J].计算机仿真,2019,36(5):395-398. 被引量：6

引证文献3

1唐风扬,覃仁超,熊健.基于局部密度信息熵均值的密度峰值聚类算法[J].计算机测量与控制,2022,30(3):192-197. 被引量：5
2刘云龙,孟凤莹,周蓉.基于经验模态分解的室内指纹定位算法[J].计算机应用,2022,42(S01):247-251.
3李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1

二级引证文献6

1万年红,王雪蓉.多目标事务模糊关联聚类的云制造服务组合算法[J].计算机测量与控制,2022,30(6):287-295. 被引量：2
2卢雪松,罗秋霞,彭毅秦,丁捷,刘春燕,肖猛,何江红,程利思,李奥兰.基于熵权法软包装红烧牦牛酸醡肉关键工艺优化[J].中国调味品,2022,47(7):146-150. 被引量：1
3刘晓佳,李剑,刘代劲,魏晓曼,孔庆珊,金艳.基于时窗熵的冲击波到时提取方法研究[J].计算机测量与控制,2023,31(3):281-286. 被引量：1
4张福华,刘丽,朱俊东,朱再新,余大权.基于信息熵更新权重的数据自适应聚类研究[J].电子设计工程,2023,31(16):176-179.
5周浩岩,叶军,谢立,卢岚,李兆彬.基于果蝇算法优化的粗糙C均值聚类算法[J].南昌工程学院学报,2023,42(4):79-86.
6王欣,张恭源.基于小波变换的35kV变电站供10kV电炉变压器负荷保护检测方法[J].工业加热,2024,53(6):80-84.

1何伟军.让学生参与统计学习的过程——独立性检验的教学和反思[J].好日子,2021(25):217-217.
2王卫东,徐金慧,张志峰,杨习贝.基于密度峰值聚类的高斯混合模型算法[J].计算机科学,2021,48(10):191-196. 被引量：10
3柳利君,康占军,郑世奇,王建军.基于CAVF法的混凝土搅拌设备级配自动化控制系统[J].自动化技术与应用,2021,40(10):149-152.
4代永杨,张清华,支学超.融合相对密度与近邻关系的密度峰值聚类算法[J].重庆邮电大学学报（自然科学版）,2021,33(5):791-805. 被引量：5
5黄学雨,向驰,陶涛.基于MapReduce和改进密度峰值的划分聚类算法[J].计算机应用研究,2021,38(10):2988-2993. 被引量：6

计算机工程与应用

2021年第20期

浏览历史

内容加载中请稍等...

Ball-Tree优化的密度峰值聚类算法被引量：3

参考文献4

二级参考文献37

共引文献132

同被引文献30

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Ball-Tree优化的密度峰值聚类算法 被引量：3

参考文献4

二级参考文献37

共引文献132

同被引文献30

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

Ball-Tree优化的密度峰值聚类算法被引量：3