期刊文献+

一种改进的DBSCAN密度算法 被引量:35

An Improved Algorithm of DBSCAN
下载PDF
导出
摘要 DBSCAN算法是一种基于密度的聚类算法,算法存在许多优点,也存在一些不足。比如对输入参数Eps敏感,DB-SCAN由于采用全局Eps值,所以在数据密度不均匀和类间距离相差比较大的情况下,聚类质量会受到很大影响。文中主要针对算法输入参数Eps以及数据密度不均匀问题加以改进,提出了一种新的数据分区方法,通过对k-dist图纵坐标距离值单维度聚类,然后对比横坐标实现分区,使每个分区的数据尽可能均匀。实验证明,改进算法明显缓解了全局Eps导致的聚类质量恶化问题,聚类结果更加准确。 The algorithm of DBSCAN is an algorithm based on density,including both many points and also shortages.For example the algorithm is sensitive to the input parameters,because the algorithm uses the global Eps,therefore in the case of uneven data and the larger distance between classes,the clustering quality will be greatly affected.Mainly improved the choice of Eps,and solved the problem of uneven data.Proposed a new method of data partition,by clustering the value of k-dist vertical axis,the algorithm completed partition.Each data partition was uniform.Experimental results show that improved algorithm eases the problem of deterioration clustering quality significantly.The improved algorithm has a more accurate result of clustering.
出处 《计算机技术与发展》 2011年第2期30-33,38,共5页 Computer Technology and Development
基金 安徽省教育科研重点项目(KJ2009A57)
关键词 DBSCAN算法 EPS 数据分区 K-dist图 DBSCAN Eps data partition K-dist
  • 相关文献

参考文献10

  • 1HandD MannilarH SmythP.数据挖掘原理[M].北京:机械工业出版社,2003..
  • 2Ester,Martin, Kriegel H P,et al. A Density Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise [ C ]//Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining(KDD-96). Ortland, Oregon : [ s. n. ], 1996.
  • 3李莉平,沈俊媛.基于数据挖掘的DBSCAN算法及其应用[J].科技创业月刊,2009,22(8):134-135. 被引量:4
  • 4Daszykowski M, Walczak B,Massart D L. Looking for Natural Patterns In Data [ J ]. Chemometics and Intelligent Laboratory Systems, 2001,56 : 83 - 92.
  • 5任兴平,何忠龙,孟增辉.改进DBSCAN算法中参数Eps值的确定[J].现代电子技术,2007,30(11):120-121. 被引量:5
  • 6Ankerst M, Breunig M, Kriegel H P, et al. Optics: Ordering points to Identify the Clustering Structure [ C ]//Proceedings of ACM SIGMOD International Conference on Management of Data. Philadephia : ACM Press, 1999:49-60.
  • 7高舁.基于密度聚类算法的改进方法研究[D].大连:大连理工大学,2007.
  • 8谭颖,胡瑞飞,殷国富.多密度阈值的DBSCAN改进算法[J].计算机应用,2008,28(3):745-748. 被引量:16
  • 9冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量:89
  • 10周水庚,周傲英,曹晶.基于数据分区的DBSCAN算法[J].计算机研究与发展,2000,37(10):1153-1159. 被引量:99

二级参考文献31

  • 1刘海虹,刘伯莹.数据挖掘技术[J].丹东纺专学报,2001,8(1):30-31. 被引量:9
  • 2刘高军,朱嬿.基于数据挖掘技术的建筑企业信用评价[J].中国矿业大学学报,2005,34(4):494-499. 被引量:21
  • 3HU Ruifei YIN Guofu TAN Ying CAI Peng.COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY[J].Chinese Journal of Mechanical Engineering,2006,19(4):544-547. 被引量:4
  • 4王惠琴.数字图像处理[M].北京:邮电大学出版社.2006.
  • 5周水庚,复旦大学计算机科学系技术报告,1999年
  • 6Zhan W,Proc of the 2 3 rd VL DB Conference,1997年,186页
  • 7Chen M S,IEEE Trans Knowledge Data Engineering,1996年,8卷,6期,866页
  • 8Zhang T,Proc ACM SIGMOD Int Conf on Management of Data,1996年,73页
  • 9Ng R T,Proc 20th VL DB Conference,1994年,144页
  • 10La Jolla,Department of Computer Science and Engineering,University of California,San Diego.Alternatives to the K -means Algorithm that Find Better Clustering,CA92093.

共引文献222

同被引文献359

引证文献35

二级引证文献234

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部