基于密度峰值剪枝后的最短路径聚类算法被引量：6

Clustering by Pruning Paths Based on Shortest Paths from Density Peaks

下载PDF

导出

摘要聚类是通过数据标签或者属性,将一系列经验数据按照相似性或者相近性进行归类.基于密度属性展开的聚类算法,主要聚焦在聚类中心的确定和剩余点如何分配的问题上展开讨论.针对基于密度峰值的可训练最短路径算法,通过密度峰值确定聚类中心,提出使用截断阈值、对路径图进行剪枝的算法改进.然后基于最短路径法对剩余点进行全局分配.实验结果证明,在保持聚类精度的同时,有效地提升了算法执行效率. Clustering is to classify multiple empirical data according to their similarity or proximity based on data labels and properties.For the clustering algorithm based on the density peaks,it mainly focuses on the determination of the clustering center and how to allocate the remaining points.In this paper,according to a trainable clustering algorithm based on shortest paths to density peaks,the clustering center is determined by the density peaks.We propose that using a cutoff threshold and pruning the path graph to improve the algorithm.The remaining points are allocated globally based on the shortest path method.It is proved that the algorithm can significantly improve the efficiency while maintaining the clustering accuracy.

作者胡恩祥汪春雨潘美芹 HU Enxiang;WANG Chunyu;PAN Meiqin(School of Business and Management,Shanghai International Studies University,Shanghai 201600,China;School of Computer Science and Technology,East China Normal University,Shanghai 200062,China)

机构地区上海外国语大学国际工商管理学院华东师范大学计算机科学与技术学院

出处《应用科学学报》 CAS CSCD 北大核心 2020年第5期792-802,共11页 Journal of Applied Sciences

基金上海外国语大学规划项目基金(No.2019114009)资助。

关键词聚类密度峰值最短路径法路径剪枝 clustering density peak shortest path method pruning path

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1周水庚,周傲英,曹晶.基于数据分区的DBSCAN算法[J].计算机研究与发展,2000,37(10):1153-1159. 被引量：99
2谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
3WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：62
4高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
5蒋礼青,张明新,郑金龙,戴娇,尚赵伟.快速搜索与发现密度峰值聚类算法的优化研究[J].计算机应用研究,2016,33(11):3251-3254. 被引量：33
6周水庚,周傲英,曹晶,胡运发.一种基于密度的快速聚类算法[J].计算机研究与发展,2000,37(11):1287-1292. 被引量：89
7夏鲁宁,荆继武.SA-DBSCAN:一种自适应基于密度聚类算法[J].中国科学院研究生院学报,2009,26(4):530-538. 被引量：81

二级参考文献89

1..http://www.ics.uci.edu/mleam/MLSununary.html,.
2MacQueen J.Some methods for classification and analysis of multivariate observations[C]//LeCam L,Neyman J,eds.Proceedings of the Fifth Berkeley Symposium on Mathematics,Statistics and Probability.Berkeley:University of California Press,1967:281-297.
3Leonard Kaufman,Peter J Rousseenw.Finding groups in data:An introduction to cluster analysis[M].New York:Wiley Press,2005.
4Tan P N,Steinbach M,Kumar V 著,范明,范宏建,等译,数据挖掘导论(Introduction to DataMining).北京:人民邮电出版社,2006.
5Ester M,Kriegel H P,Sander J.A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Simoudis E,Hart JW,Fayyad UM,eds.Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining.Portland:AAAI Press,1996:226-231.
6Ankerst M,Breunig M M,Kriegcl H P.OPTICS:ordering points to identify the clustering structure[C]//Alex Dells,Christns Faloutscs,Shahram Ghandeharizadeh eds.Proceedings of the ACM SIGMOD'99 lnt Conf on Management of Data.Philadelphia Pennsylvania:ACM Press,1999:49-60.
7Hinneburg A,Keim D A.An efficient approach to clustering in large multimedia databases with noise[C]//Rakesh Agrawal,Paul Stolorz,eds.Proceedings of the 4th lnt Conf on Knowledge Discovery and Data Mining.New York:AAAI Press,1998:58-65.
8Feng P J,C,e L D.Adaptive DBSCAN-bused algorithm for constellation reconstruction and modulation identification[C]//Keyun Tang,Dayong Lio,eds.Proceedings of Radio Science Conference 2004.Beijing:Pub House of Electronics Industry,2004:177-180.
9Halkidi M,Vazirgiannis M.Clustering validity assessment:finding the optimal partitioning of a data set[C]//Nick Cerenne,Tsau Young Lin,Xindeng Wu eds.Prueecdings of the 2001 IEEE International Conference on Data Mining.California:IEEE Computer Society,2001:187-194.
10Yue S H,Li P,Guo J D,et al.A statistical information-based clustering approach in distance space[J].Journal of Zhejiang University Science,2005,6A(1):71-78.

共引文献437

1孙伟鹏,吴锡生,孟斌.基于Spark并行的密度峰值聚类算法[J].计算机应用研究,2020,37(1):163-166. 被引量：2
2宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：25
3陆小莉,刘强,徐生霞.中国产业转型升级的空间分异与影响机制研究[J].经济问题探索,2021(2):135-144. 被引量：5
4夏飞,张洁,张浩,陆剑峰.基于BIC准则和加权皮尔逊距离的居民负荷模式精细识别及预测[J].电子测量与仪器学报,2020,32(11):33-42. 被引量：16
5梁敏君,倪志伟,倪丽萍,杨葛钟啸.基于网格与分形维数的聚类算法[J].计算机应用,2009,29(3):830-832. 被引量：4
6周文勇.改进的K-均值聚类算法[J].光盘技术,2007(2):54-56. 被引量：6
7王海,王忠民.一种基于密度和网格的聚类算法在KDD中的应用[J].计算机工程与应用,2004,40(24):180-182. 被引量：3
8周永权,焦李成.高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J].电子学报,2004,32(8):1342-1345. 被引量：3
9宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
10林小红,蒋伟进.基于RS近似算法的医疗诊断知识挖掘[J].海军工程大学学报,2004,16(5):48-51.

同被引文献59

1苏浩,李钦富,蔡俊.A^＊算法在基于道路网的路径规划中的应用[J].中国电子科学研究院学报,2010,5(4):419-422. 被引量：2
2贺丽娜,楼佩煌,钱晓明,刘冉.基于时间窗的自动导引车无碰撞路径规划[J].计算机集成制造系统,2010,16(12):2630-2634. 被引量：45
3陆俊,陈志敏,龚钢军,徐志强,祁兵.基于极限学习机的居民用电行为分类分析方法[J].电力系统自动化,2019,43(2):97-104. 被引量：41
4谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
5刘思,李林芝,吴浩,孙维真,傅旭华,叶承晋,黄民翔.基于特性指标降维的日负荷曲线聚类分析[J].电网技术,2016,40(3):797-803. 被引量：59
6马春来,单洪,马涛.一种基于簇中心点自动选择策略的密度峰值聚类算法[J].计算机科学,2016,43(7):255-258. 被引量：47
7傅军栋,杨姚,罗善江.智能小区居民用电负荷特征权重分析[J].电力系统保护与控制,2016,44(18):41-45. 被引量：8
8蒋礼青,张明新,郑金龙,戴娇,尚赵伟.快速搜索与发现密度峰值聚类算法的优化研究[J].计算机应用研究,2016,33(11):3251-3254. 被引量：33
9罗滇生,杜乾,别少勇,庞振国,李盛兴.基于负荷分解的居民差异化用电行为特性分析[J].电力系统保护与控制,2016,44(21):29-33. 被引量：30
10王堃,杨飞,李斌.用电采集大数据的用户用电行为分析研究[J].电力大数据,2017,20(10):1-6. 被引量：12

引证文献6

1崔立卿,王胜男,田晶.基于K-均值聚类算法的大客户用电行为分析[J].电力大数据,2021,24(2):69-77. 被引量：5
2张海亮,张征.基于GeoHash索引的A^(*)算法优化[J].火力与指挥控制,2021,46(6):78-83.
3刘美,王全民.基于密度可达的密度峰值聚类算法[J].计算机仿真,2022,39(11):371-375. 被引量：2
4赵嘉,陈磊,吴润秀,张波,韩龙哲.K近邻和加权相似性的密度峰值聚类算法[J].控制理论与应用,2022,39(12):2349-2357. 被引量：16
5侯艳丽,马震.基于深度优先搜索的分层网络最短路径算法[J].无线电通信技术,2023,49(4):684-688. 被引量：2
6王晨宇,张钊,侯佳龙,周红艳,陈雪波.基于密度峰值聚类和改进LWLR的短期电力负荷预测[J].东北电力大学学报,2024,44(4):113-120. 被引量：1

二级引证文献26

1李智冈,吕莉,谭德坤,康平,樊棠怀.基于加权核密度估计与微簇合并的密度峰值聚类算法[J].信息与控制,2024,53(3):302-314.
2陈丝雨,夏勇.居民用电行为特性分析软件的实现[J].电子技术与软件工程,2021(19):222-223.
3韩明冲,钟建伟,陈静,黄明,张继学,鄢蓓.面向电力大数据的用电负荷分类及用户用电行为分析[J].物联网技术,2022,12(3):113-115. 被引量：6
4赵雯.基于模糊聚类的分散型多用户高校差异化用电行为分析[J].黑龙江科学,2023,14(9):97-99.
5李波,赵瑞锋,卢建刚,黎皓彬,陈志伟,李世明.基于聚类算法的电力大数据信息分析系统研究[J].自动化仪表,2023,44(8):84-90. 被引量：2
6马振明,安俊秀.基于空间向量搜索的密度峰值聚类算法[J].计算机工程与应用,2023,59(15):123-131. 被引量：1
7王艺霖,肖媛媛,左鹏飞,杨博,刘悦霞,段宗涛.基于改进聚类算法的交通事故多发点识别方法[J].计算机应用研究,2023,40(10):2993-2999. 被引量：3
8陈金鹏,安俊秀,李睿熙.基于密度万有引力改进的引力峰值聚类算法[J].山西大学学报（自然科学版）,2023,46(5):1064-1075.
9李全贵,李建波,胡千庭,吴江杰,郑梦浩,李赏,周俊江.基于案例推理的煤与瓦斯突出预警模型研究[J].矿业安全与环保,2023,50(5):24-29. 被引量：4
10吴学礼,宋凯,史思远,栗玉洁.基于改进马尔可夫随机场探地雷达有效信号提取方法[J].科学技术与工程,2023,23(30):13031-13039. 被引量：1

1李宗辰.基于信心论对传统K-means算法改进[J].中国设备工程,2020(19):117-118.
2黄治力,谌永祥,李永桥.基于核相关性保持的子空间聚类算法[J].西南科技大学学报,2020,35(3):80-85. 被引量：1
3卢江波,龙海滨,张铭,唐盛华.初至波层析成像正演模拟中多发多收模式计算方法研究[J].地球物理学进展,2020,35(4):1590-1594. 被引量：1
4叶亮.基于动态评估的高速公路服务区布局方法研究[J].交通工程,2020,20(5):44-48. 被引量：3
5甘泳机,尹成友,范启蒙,李安琪.电大目标的对比度源逆散射成像方法研究[J].微波学报,2020,36(4):25-32. 被引量：1
6周磊,董学育,朱建忠,孙飞.基于改进蜂群算法的微电网优化调度[J].电气自动化,2020,42(5):45-47. 被引量：7
7李顺勇,张钰嘉,彭晓庆,曹付元,刘恩乾.一种基于分层抽样的大数据快速聚类算法[J].计算机应用与软件,2020,37(10):256-261. 被引量：5
8冉冉,徐立波,曲睿婷,夏雨.基于LDA-FCM方法的Web服务发现聚类性能分析[J].计算技术与自动化,2020,39(3):166-171. 被引量：1
9阮嘉琨,蔡延光,蔡颢,张丽.基于灰狼算法的Simhash冗余数据检测算法[J].东莞理工学院学报,2020,27(5):38-43. 被引量：4
10郑美娟.WOA算法的城市土地利用类型空间的优化配置[J].龙岩学院学报,2020,38(5):66-69.

应用科学学报

2020年第5期

浏览历史

内容加载中请稍等...

基于密度峰值剪枝后的最短路径聚类算法被引量：6

参考文献7

二级参考文献89

共引文献437

同被引文献59

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于密度峰值剪枝后的最短路径聚类算法 被引量：6

参考文献7

二级参考文献89

共引文献437

同被引文献59

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于密度峰值剪枝后的最短路径聚类算法被引量：6