一种改进的DBSCAN密度算法被引量：35

An Improved Algorithm of DBSCAN

下载PDF

导出

摘要 DBSCAN算法是一种基于密度的聚类算法,算法存在许多优点,也存在一些不足。比如对输入参数Eps敏感,DB-SCAN由于采用全局Eps值,所以在数据密度不均匀和类间距离相差比较大的情况下,聚类质量会受到很大影响。文中主要针对算法输入参数Eps以及数据密度不均匀问题加以改进,提出了一种新的数据分区方法,通过对k-dist图纵坐标距离值单维度聚类,然后对比横坐标实现分区,使每个分区的数据尽可能均匀。实验证明,改进算法明显缓解了全局Eps导致的聚类质量恶化问题,聚类结果更加准确。 The algorithm of DBSCAN is an algorithm based on density,including both many points and also shortages.For example the algorithm is sensitive to the input parameters,because the algorithm uses the global Eps,therefore in the case of uneven data and the larger distance between classes,the clustering quality will be greatly affected.Mainly improved the choice of Eps,and solved the problem of uneven data.Proposed a new method of data partition,by clustering the value of k-dist vertical axis,the algorithm completed partition.Each data partition was uniform.Experimental results show that improved algorithm eases the problem of deterioration clustering quality significantly.The improved algorithm has a more accurate result of clustering.

作者于亚飞周爱武

机构地区安徽大学计算机科学与技术学院

出处《计算机技术与发展》 2011年第2期30-33,38,共5页 Computer Technology and Development

基金安徽省教育科研重点项目(KJ2009A57)

关键词 DBSCAN算法 EPS 数据分区 K-dist图 DBSCAN Eps data partition K-dist

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1HandD MannilarH SmythP.数据挖掘原理[M].北京:机械工业出版社,2003..
2Ester,Martin, Kriegel H P,et al. A Density Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise [ C ]//Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining(KDD-96). Ortland, Oregon : [ s. n. ], 1996.
3李莉平,沈俊媛.基于数据挖掘的DBSCAN算法及其应用[J].科技创业月刊,2009,22(8):134-135. 被引量：4
4Daszykowski M, Walczak B,Massart D L. Looking for Natural Patterns In Data [ J ]. Chemometics and Intelligent Laboratory Systems, 2001,56 : 83 - 92.
5任兴平,何忠龙,孟增辉.改进DBSCAN算法中参数Eps值的确定[J].现代电子技术,2007,30(11):120-121. 被引量：5
6Ankerst M, Breunig M, Kriegel H P, et al. Optics: Ordering points to Identify the Clustering Structure [ C ]//Proceedings of ACM SIGMOD International Conference on Management of Data. Philadephia : ACM Press, 1999:49-60.
7高舁.基于密度聚类算法的改进方法研究[D].大连:大连理工大学,2007.
8谭颖,胡瑞飞,殷国富.多密度阈值的DBSCAN改进算法[J].计算机应用,2008,28(3):745-748. 被引量：16
9冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量：89
10周水庚,周傲英,曹晶.基于数据分区的DBSCAN算法[J].计算机研究与发展,2000,37(10):1153-1159. 被引量：99

二级参考文献31

1刘海虹,刘伯莹.数据挖掘技术[J].丹东纺专学报,2001,8(1):30-31. 被引量：9
2刘高军,朱嬿.基于数据挖掘技术的建筑企业信用评价[J].中国矿业大学学报,2005,34(4):494-499. 被引量：21
3HU Ruifei YIN Guofu TAN Ying CAI Peng.COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY[J].Chinese Journal of Mechanical Engineering,2006,19(4):544-547. 被引量：4
4王惠琴.数字图像处理[M].北京:邮电大学出版社.2006.
5周水庚，复旦大学计算机科学系技术报告，1999年
6Zhan W，Proc of the 2 3 rd VL DB Conference，1997年，186页
7Chen M S，IEEE Trans Knowledge Data Engineering，1996年，8卷，6期，866页
8Zhang T，Proc ACM SIGMOD Int Conf on Management of Data，1996年，73页
9Ng R T，Proc 20th VL DB Conference，1994年，144页
10La Jolla,Department of Computer Science and Engineering,University of California,San Diego.Alternatives to the K -means Algorithm that Find Better Clustering,CA92093.

共引文献222

1宗长富,文龙,何磊.基于欧几里得聚类算法的三维激光雷达障碍物检测技术[J].吉林大学学报（工学版）,2020,50(1):107-113. 被引量：25
2毕方明,张虹,曹天杰.非均匀Hilbert曲线的生成算法[J].中国矿业大学学报,2009,38(5):729-734. 被引量：3
3宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
4栾丽华,吉根林.一种基于四叉树的快速聚类算法[J].计算机应用,2005,25(5):1001-1003. 被引量：6
5倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
6尹松,周永权,李陶深.数据聚类方法的研究与分析[J].航空计算技术,2005,35(1):63-66. 被引量：16
7熊忠阳,孙思,张玉芳,王秀琼.一种基于划分的不同参数值的DBSCAN算法[J].计算机工程与设计,2005,26(9):2319-2321. 被引量：16
8伊胜伟,刘旸,魏红芳.基于数据挖掘的入侵检测系统智能结构模型[J].计算机工程与设计,2005,26(9):2464-2466. 被引量：10
9吴志勇,吴跃.数据挖掘在电信业中的应用研究[J].计算机应用,2005,25(B12):213-214. 被引量：11
10何中胜,刘宗田,庄燕滨.基于数据分区的并行DBSCAN算法[J].小型微型计算机系统,2006,27(1):114-116. 被引量：16

同被引文献359

1王建州,马志新,李廉.基于混沌的异常数据的动态识别与挖掘[J].清华大学学报（自然科学版）,2005,45(S1):1753-1756. 被引量：7
2郭世可,董槐林,龙飞,张海波.一种结合密度聚类和区域生长的图像分割方法[J].计算机研究与发展,2007,44(z3):420-423. 被引量：3
3罗毅.高校图书馆荐购系统现状与问题研究[J].图书馆学研究（应用版）,2010(12):46-49. 被引量：39
4宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
5伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
6廖旭,张力.工作流管理系统中一种基于任务的委托模式[J].计算机工程与应用,2005,41(7):44-46. 被引量：5
7倪巍伟,孙志挥,陆介平.k-LDCHD——高维空间k邻域局部密度聚类算法[J].计算机研究与发展,2005,42(5):784-791. 被引量：18
8刘高军,朱嬿.基于数据挖掘技术的建筑企业信用评价[J].中国矿业大学学报,2005,34(4):494-499. 被引量：21
9陈燕俐,洪龙,金达文,朱梧槚.一种简单有效的基于密度的聚类分析算法[J].南京邮电学院学报（自然科学版）,2005,25(4):24-29. 被引量：8
10李订芳,章文,何炎祥.一种新的带模糊权的粗糙聚类算法[J].信息与控制,2006,35(1):120-125. 被引量：3

引证文献35

1唐小新,李高虎,唐秋鸿,曹红兵,高嵩.高校图书馆个性化电子图书荐购系统的设计和实现[J].现代图书情报技术,2012(3):83-88. 被引量：13
2周红芳,赵雪涵,周扬.基于限定区域数据取样的密度聚类算法[J].计算机应用,2012,32(8):2182-2185. 被引量：5
3张宏兵,陆建峰,汤九斌.一种基于近似EMD的DBSCAN改进算法[J].山东大学学报（工学版）,2012,42(4):35-40. 被引量：5
4郑宗良.基于改进DBSCAN算法的应急预案编制[J].计算机工程与科学,2012,34(9):149-153. 被引量：1
5周红芳,王鹏.DBSCAN算法中参数自适应确定方法的研究[J].西安理工大学学报,2012,28(3):289-292. 被引量：42
6金保华,林青,赵家明.基于可调整邻域阈值的DBSCAN算法在应急预案分类管理中的应用[J].郑州轻工业学院学报（自然科学版）,2012,27(6):9-13.
7张悦,刘杰,李航.一种基于概率的孤立点检测方法[J].计算机工程,2013,39(3):46-50. 被引量：2
8朱烜璋.基于DBSCAN的无线传感网定位方法[J].计算机工程与应用,2013,49(11):80-83. 被引量：7
9徐海啸,麻婧,吴旗.DBSCAN算法在高性能计算中心用户分类的应用研究[J].吉林大学学报（信息科学版）,2013,31(5):528-534. 被引量：2
10张翼飞,魏现辉.时间序列下超大规模数据流聚类方法研究[J].计算机仿真,2014,31(4):273-276. 被引量：1

二级引证文献234

1张怡霄,郭文普,康凯,姚云龙,王攀.基于聚类与网格搜索的TDOA/DOA联合定位方法[J].战术导弹技术,2020(1):105-112. 被引量：3
2杨婷,郑雅玲,余帆,李应昆.基于CiteSpace对便秘研究的文献计量学及可视化分析[J].世界最新医学信息文摘,2019,19(76):51-54. 被引量：2
3侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
4张政,孙鹏,王立勇,苏清华.基于边缘卷积的交通锥筒点云数据分割方法[J].电子测量技术,2023,46(20):98-103.
5仇景明,曲桦,赵季红.一种鲁棒网络流量分类及新类型发现算法[J].北京邮电大学学报,2020(2):40-45. 被引量：2
6刘佳佳.基于书目检索信息的图书荐购系统[J].图书情报工作,2012,56(15):82-87. 被引量：6
7王艳超,杨立才,刘澄玉.基于模板匹配和镜像延拓的两阶段经验模态分解算法[J].山东大学学报（工学版）,2012,42(6):69-73. 被引量：3
8李自辉.基于B/S架构的图书馆管理系统的设计与实现[J].科技信息,2013(14):285-285.
9李克潮,蓝冬梅,凌霄娥.一种高校读者借阅偏好的个性化图书推荐[J].现代情报,2013,33(8):68-72. 被引量：3
10王泽贤.高校图书馆整合型荐购系统的设计与实现[J].图书情报工作,2013,57(20):116-122. 被引量：10

1王洪佳,邢长征,王星.基于相对密度的多耦合文本聚类算法[J].计算机应用研究,2016,33(6):1624-1627. 被引量：2
2许芳芳.一种结合蚁群聚类算法的DBSCAN算法[J].池州学院学报,2014,28(6):33-36. 被引量：2
3帅剑平,周娅.基于聚类算法的个性化搜索研究[J].计算机系统应用,2009,18(1):62-65. 被引量：1
4帅剑平,周娅,徐芳虹.一种有效的基于密度聚类的排序算法[J].郑州大学学报（理学版）,2009,41(2):52-55.
5赵文,夏桂书,苟智坚,闫振兴.一种改进的DBSCAN算法[J].四川师范大学学报（自然科学版）,2013,36(2):312-316. 被引量：17
6罗雅丽.基于常职院考试题库管理系统的总体设计[J].消费电子,2013(2):30-31.
7冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量：89
8赵杰,杨柳.聚类分析算法dBscan的改进与实现[J].微电子学与计算机,2009,26(11):189-192. 被引量：14
9林姿琼,黄伟婷.改进的DBSCAN空间聚类算法研究[J].漳州师范学院学报（自然科学版）,2009,22(1):22-25. 被引量：1
10刘学.K-Dmeans算法应用研究[J].科技信息,2013(19):79-79.

计算机技术与发展

2011年第2期

浏览历史

内容加载中请稍等...

一种改进的DBSCAN密度算法被引量：35

参考文献10

二级参考文献31

共引文献222

同被引文献359

引证文献35

二级引证文献234

相关作者

相关机构

相关主题

浏览历史

一种改进的DBSCAN密度算法 被引量：35

参考文献10

二级参考文献31

共引文献222

同被引文献359

引证文献35

二级引证文献234

相关作者

相关机构

相关主题

浏览历史

一种改进的DBSCAN密度算法被引量：35