基于数据分区的DBSCAN算法被引量：98

A DATA-PARTITIONING-BASED DBSCAN ALGORITHM

下载PDF

导出

摘要数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时候就需要较多的内存和 I/O开销 ;此外 ,当数据密度和聚类间的距离不均匀时聚类质量较差 .为此 ,在分析 DBSCAN算法不足的基础上 ,提出了一个基于数据分区的 DBSCAN算法 .测试结果表明新算法不仅提高了聚类速度 ,而且改善了聚类质量 . Clustering is a promising application technique for many fields including data mining, pattern recognition, image processing, compression and other business applications. DBSCAN is a density based clustering algorithm that can efficiently discover clusters of arbitrary shape and can effectively handle noise. However, it requires large volume of memory support and needs a lot of I/O costs when dealing with large scale databases because it operates directly on the entire databases. Furthermore, clustering quality will degrade when the cluster density and the distance between clusters are not even. In this paper, an improved DBSCAN algorithm is presented on the basis of data partitioning. Experimental results show that the new algorithm is superior to the original DBSCAN in efficiency.

作者周水庚周傲英曹晶

机构地区复旦大学计算机科学系上海(国际)数据库研究中心上海

出处《计算机研究与发展》 EI CSCD 北大核心 2000年第10期1153-1159,共7页 Journal of Computer Research and Development

基金国家自然科学基金!(项目编号 6 9743 0 0 1) 国家教委博士点基金

关键词空间数据库数据挖掘数据分区 DBSCAN算法 spatial database, data mining, clustering, data partitioning, DBSCAN algorithm

分类号 TP311.132 [自动化与计算机技术—计算机软件与理论] TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1周水庚，复旦大学计算机科学系技术报告，1999年
2Zhan W，Proc of the 2 3 rd VL DB Conference，1997年，186页
3Chen M S，IEEE Trans Knowledge Data Engineering，1996年，8卷，6期，866页
4Zhang T，Proc ACM SIGMOD Int Conf on Management of Data，1996年，73页
5Ng R T，Proc 20th VL DB Conference，1994年，144页

同被引文献790

1卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020,37(S01):9-15. 被引量：25
2陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量：223
3饶雷,冉军,陶建权,胡号朋,吴沁,熊圣新.基于随机森林的海上风电机组发电机轴承异常状态监测方法[J].船舶工程,2022,44(S02):27-31. 被引量：6
4冯泽磊,吴美凤.动态浮箱数据清洗方法在电力系统中的应用[J].发电技术,2019,40(S1):109-113. 被引量：5
5李清峰,周鲜成,王莉,周伟林.一种不精确数据的聚类挖掘方法[J].计算机应用研究,2009,26(3):887-889. 被引量：1
6郭世可,董槐林,龙飞,张海波.一种结合密度聚类和区域生长的图像分割方法[J].计算机研究与发展,2007,44(z3):420-423. 被引量：3
7竺可桢.中国近五千年来气候变迁的初步研究[J].考古学报,1972(1):15-38. 被引量：1293
8宋建.试论滁河流域的周代文化[J].东南文化,1990(5):364-373. 被引量：3
9Zeineb Lassoued,Kamel Abderrahim.New Results on PWARX Model Identification Based on Clustering Approach[J].International Journal of Automation and computing,2014,11(2):180-188. 被引量：1
10钱锋,徐麟文.知识发现中的聚类分析及其应用[J].杭州师范大学学报（自然科学版）,2001,5(1):34-37. 被引量：16

引证文献98

1宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：24
2宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
3栾丽华,吉根林.一种基于四叉树的快速聚类算法[J].计算机应用,2005,25(5):1001-1003. 被引量：6
4倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
5尹松,周永权,李陶深.数据聚类方法的研究与分析[J].航空计算技术,2005,35(1):63-66. 被引量：16
6熊忠阳,孙思,张玉芳,王秀琼.一种基于划分的不同参数值的DBSCAN算法[J].计算机工程与设计,2005,26(9):2319-2321. 被引量：16
7伊胜伟,刘旸,魏红芳.基于数据挖掘的入侵检测系统智能结构模型[J].计算机工程与设计,2005,26(9):2464-2466. 被引量：10
8何中胜,刘宗田,庄燕滨.基于数据分区的并行DBSCAN算法[J].小型微型计算机系统,2006,27(1):114-116. 被引量：16
9清华同方RFID远距离车辆进出管理系统[J].金卡工程,2006,10(4):40-41.
10李伟,黄颖.文本聚类算法的比较[J].科技情报开发与经济,2006,16(22):234-236. 被引量：4

二级引证文献601

1郭鹏飞,李海霞,常海艳,白柯鑫,张煜.基于大数据的海上目标隐性关联规则挖掘方法[J].网络安全与数据治理,2023,42(S01):71-77. 被引量：1
2惠记庄,张泽宇,叶敏,顾海荣,张浩博,段雨.公路建养装备数字孪生技术综述[J].交通运输工程学报,2023,23(4):23-44. 被引量：8
3郭威,唐慧丰.基于轨迹聚类的航空器轨迹模式挖掘研究[J].计算机应用研究,2020,37(2):416-420. 被引量：3
4张浩,左杭,刘宝华.视觉与二维激光雷达的目标检测方法[J].电子测量与仪器学报,2022,36(3):79-86. 被引量：13
5张政,孙鹏,王立勇,苏清华.基于边缘卷积的交通锥筒点云数据分割方法[J].电子测量技术,2023,46(20):98-103.
6郑川川,柯福阳,汤琴琴.基于图优化的激光惯导紧耦合SLAM研究[J].电子测量技术,2023,46(1):35-42. 被引量：3
7杨黎娜,姚凯学,何勇,席雷鹏,刘文才,赵继露.基于SmoteEnn_XGBoost模型的路况感知方法研究[J].智能计算机与应用,2021,11(11):137-142. 被引量：1
8袁秀行.数字化背景下的商业银行信贷转型探讨[J].财经界,2021(15):5-6. 被引量：2
9陆杨.浅析数据挖掘技术及应用[J].电脑知识与技术（过刊）,2007(14):511-512. 被引量：2
10原福永,杨治秋,王海霞.一种基于向量空间模型的文档聚类算法研究[J].信号处理,2005,21(z1):606-608.

1聂跃光,陈立潮,陈湖.基于密度的空间聚类算法研究[J].计算机技术与发展,2008,18(8):91-94. 被引量：6
2王海燕,李晓玲.聚类分析技术在CRM中的应用研究[J].电子世界,2015(18):186-187.
3王晓洁,方丽娜.一种基于密度的空间聚类算法[J].新乡学院学报,2008,25(1):59-61.
4杨杨,孙志伟,赵政.一种处理障碍约束的基于密度的空间聚类算法[J].计算机应用,2007,27(7):1688-1691. 被引量：6
5孙洁娣,李玉霞,温江涛,闫盛楠.基于密度的空间聚类与霍夫变换相结合的欠定盲源分离混合矩阵估计[J].高技术通讯,2014,24(12):1270-1278. 被引量：3
6孙志伟.存在物理约束下的基于密度的空间聚类算法[J].计算机应用研究,2009,26(3):873-875. 被引量：1
7张嘉成,杜渂.聚类分析在城市客流聚集风险分析中的应用[J].电信快报（网络与通信）,2017(1):25-30.
8刘峰,刘希玉,刘弘.流形上的空间密度聚类算法研究[J].中国海洋大学学报（自然科学版）,2007,37(4):681-684. 被引量：1
9唐皓,刘希玉.基于密度流形上的空间聚类[J].河北大学学报（自然科学版）,2009,29(6):658-662.
10李今,石晓润.基于密度的空间聚类算法在照明运维中的应用[J].软件导刊,2017,16(4):148-151.

计算机研究与发展

2000年第10期

浏览历史

内容加载中请稍等...

基于数据分区的DBSCAN算法被引量：98

参考文献5

同被引文献790

引证文献98

二级引证文献601

相关作者

相关机构

相关主题

浏览历史

基于数据分区的DBSCAN算法 被引量：98

参考文献5

同被引文献790

引证文献98

二级引证文献601

相关作者

相关机构

相关主题

浏览历史

基于数据分区的DBSCAN算法被引量：98