一种改进的基于密度的抽样聚类算法被引量：4

An Improved Density-based Spatial Clustering Algorithm with Sampling

下载PDF

导出

摘要基于密度的聚类算法DBSCAN是一种有效的空间聚类算法,它能够发现任意形状的聚类并且有效地处理噪声。然而,DBSCAN算法也有一些缺点,例如,①在聚类时只考虑空间属性没有考虑非空间属性;②在对大规模空间数据库进行聚类分析时需要较大的内存支持和I/O消耗。为此,在分析DBSCAN算法不足的基础上,提出了一种改进的基于密度的抽样聚类(improved density-based spatial clustering algorithm with sampling,IDBSCAS)算法,使之能够有效地处理大规模空间数据库,并且它不仅考虑了空间属性也考虑了非空间属性。2维空间数据的测试结果表明,该算法是可行、有效的。 DBSCAN is one of the effective spatial clustering algorithms, which can discover clusters of any arbitrary shape and handle the noise effectively. However, it has also several disadvantages. First, it is based on only spatial attributes without considering non-spatial attributes in the databases. Second, when DBSCAN handles large-scale spatial databases, it requires large volume of memory support and I/O cost. In this paper, an improved density-based spatial clustering algorithm with sampling（IDBSCAS） is developed, which not only clusters large-scale spatial databases effectively, but also considers spatial attributes and non-spatial attributes. Experimental results of 2-D spatial datasets show that the new algorithm is feasible and efficient.

作者胡彩平秦小麟

机构地区南京航空航天大学信息科学与技术学院

出处《中国图象图形学报》 CSCD 北大核心 2007年第11期2031-2036,共6页 Journal of Image and Graphics

基金国家自然科学基金项目(60673127) 江苏省自然科学基金项目(BK2001045)

关键词空间数据挖掘空间聚类密度种子非空间属性 spatial data mining, spatial clustering, density, seeds, non-spatial attributes

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1HanJiawei MichelineKamber 范明孟小峰译.数据挖掘概念和技术[M].北京:机械工业出版社,2001..
2Ng R T,Han Jiawei.CLARANS:A method for clustering objects for spatial data mining[J].IEEE Transactions on Knowledge and Data Engineering,2002,14 (5):1003-1016.
3Guha S,Rastogi R,Shim K.CURE:An efficient clustering algorithm for large databases[A].In:Proceedings of the ACM SIGMOD International Conference on Management of Data[C],Seattle,WA,USA,1998:73-84.
4Zhang T,Ramakrishna R,Livny M.BIRCH:An efficient data clustering method for very large databases[A].In:Proceedings of the ACM SIGMOD International Conference on Management of Data[C],Montreal,Canada,1996:103-114.
5Ester M,Kriegel H,Sander J,et al.A density-based algorithm for discovering clusters in large dpatial databases with noise[A].In:Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining[C],Portland,Maine,USA,1996:226-231.
6Ankerst M,Breunig M,Kriegel H,et al.OPTICS:Ordering points to identify the clustering structure[A].In:Proceedings of the ACM SIGMOD International Conference on Management of Data[C],Philadelphia,PA,USA,1999:49-60.
7Sander J,Ester M,Kriegel H,et al.Density-based clustering in spatial databases:the algorithm GDBSCAN and its applications[J].Data Mining and Knowledge Discovery,1998,2(2):169-194.
8Wang W,Yang J,Muntz R.STING:An statistical information grid approach to spatial data mining[A].In:Proceedings of the 23th International Conference on Very Large Data Bases[C],Athens,Greece,1997:186-195.
9Sheikholeslami G,Chatterjee S,Zhang A.WaveCluster:A multi resolution clustering approach for very large spatial databases[A].In:Proceedings of the 24th International Conference on Very Large Data Bases[C],New York,USA,1998:428-439.
10Beckmann N,Kriegel H P,Schneider R,et al.The R* -Tree:An efficient and robust access method for points and rectangles[A].In:Proceedings of the ACM SIGMOD International Conference on Management of Data[C],Atlantic City,NJ,USA,1990:322-331.

共引文献11

1杨建伟,杜艳平,孙健.分布式信息共享技术的研究[J].太原重型机械学院学报,2004,25(3):188-192.
2黄水源,罗胜,段隆振,王春平.利用XML技术实现异构数据库之间的数据转换[J].南昌大学学报（工科版）,2005,27(1):85-88. 被引量：5
3李英楠,张宏莉,云晓春,方滨兴.基于网络拓扑的网络安全事件宏观预警与响应分析[J].哈尔滨工业大学学报,2005,37(11):1459-1462. 被引量：5
4马世欢,白万民,张雪霞.改进的关联规则并行算法[J].西安工业学院学报,2006,26(1):56-59.
5殷春霞,楚涛,马力.基于数据挖掘的网络性能分析系统的设计和实现[J].计算机工程,2006,32(12):136-138. 被引量：1
6但启淮,徐生菊,轩春江.共用信息平台在粮食安全预警预报系统中的应用[J].青海大学学报（自然科学版）,2006,24(4):77-79.
7刘兴涛,石冰,解英文.挖掘关联规则中Apriori算法的一种改进[J].山东大学学报（理学版）,2008,43(11):67-71. 被引量：13
8季伟东,张珑,张军.一种Apriori算法的改进[J].计算机工程与科学,2009,31(9):68-70. 被引量：3
9刘淑瑞,秦文珍,张聪.基于数据挖掘技术的图书馆采购管理研究[J].重庆文理学院学报（自然科学版）,2010,29(1):110-112. 被引量：4
10李雷,申筱彤.数据挖掘在高校图书馆图书采购计划中的应用[J].医学信息,2011,24(7):1910-1912. 被引量：5

同被引文献74

1柳家友,柏志安,吴伟华.玉米杂交种主要穗部性状之演变及对育种目标的影响[J].玉米科学,2004,12(z2):3-4. 被引量：30
2江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
3黄永平,邹力鹍.数据仓库中基于密度的批量增量聚类算法[J].计算机工程与应用,2004,40(29):206-208. 被引量：9
4宋凤斌,戴俊英.玉米对干旱胁迫的反应和适应性 Ⅱ.玉米雌穗和雄穗生长发育对干旱胁迫的反应[J].吉林农业大学学报,2005,27(1):1-5. 被引量：28
5高小梅,冯云,冯兴杰.增量式K-Medoids聚类算法[J].计算机工程,2005,31(B07):181-183. 被引量：9
6熊忠阳,孙思,张玉芳,王秀琼.一种基于划分的不同参数值的DBSCAN算法[J].计算机工程与设计,2005,26(9):2319-2321. 被引量：16
7徐新华,谢永红.增量聚类综述及增量DBSCAN聚类算法研究[J].华北航天工业学院学报,2006,16(2):15-17. 被引量：5
8陈治平,王雷,李志成.基于密度梯度的聚类算法研究[J].计算机应用,2006,26(10):2389-2392. 被引量：4
9刘青宝,邓苏,张维明.基于相对密度的聚类算法[J].计算机科学,2007,34(2):192-195. 被引量：13
10王洪春,彭宏.基于模糊C-均值的增量式聚类算法[J].微电子学与计算机,2007,24(6):156-157. 被引量：22

引证文献4

1叶培松,顾国松.数据挖掘中密度聚类算法研究[J].福建电脑,2010,26(3):88-89. 被引量：1
2吉成恒,雷咏梅.大规模数据集聚类的K邻近均匀抽样数据预处理算法[J].上海大学学报（自然科学版）,2016,22(1):28-35. 被引量：2
3韩东,杨贵军,杨浩,邱春霞,陈明杰,温维亮,牛庆林,杨文攀.基于立体视觉的玉米雄穗三维信息提取[J].农业工程学报,2018,34(11):166-173. 被引量：10
4何玉林,黄哲学.大规模数据集聚类算法的研究进展[J].深圳大学学报（理工版）,2019,36(1):4-17. 被引量：9

二级引证文献22

1张艳.基于密度和层次的快速聚类算法在数据挖掘中的设计及实现[J].信息安全与技术,2013,4(8):59-61.
2张漫,苗艳龙,仇瑞承,季宇寒,李寒,李民赞.基于车载三维激光雷达的玉米点云数据滤波算法[J].农业机械学报,2019,50(4):170-178. 被引量：19
3关绍云,郑丽坤,金一宁,郭靖天,张忠平,苗创业.基于高斯核函数的局部离群点检测算法[J].哈尔滨商业大学学报（自然科学版）,2019,35(2):185-190. 被引量：7
4谢新锐,顾晓鹤,林丽群,杨贵军,张丽妍.倒伏胁迫对水稻可视茎叶穗比率的影响及光谱响应解析[J].光谱学与光谱分析,2019,39(7):2264-2270. 被引量：4
5苏伟,蒋坤萍,郭浩,刘哲,朱德海,张晓东.地基激光雷达提取大田玉米植株表型信息[J].农业工程学报,2019,35(10):125-130. 被引量：25
6顾生浩,王勇健,温维亮,卢宪菊,于泽涛,郭新宇.基于三维冠层模型的玉米光合作用和光能利用模拟[J].农业工程学报,2019,35(20):178-184. 被引量：3
7赵玉明,舒红平,魏培阳,刘魁.基于Spark的聚类算法优化与实现[J].现代电子技术,2020,43(8):52-55. 被引量：1
8张海华,李楠楠.基于大数据K-means聚类算法的在线学习行为路径的研究[J].电子设计工程,2020,28(12):17-20. 被引量：13
9梁秀英,周风燃,陈欢,梁博,许锡晨,杨万能.基于运动恢复结构的玉米植株三维重建与性状提取[J].农业机械学报,2020,51(6):209-219. 被引量：17
10杨锴,周岩.外引内联型科研团队创新能力纵向匹配研究[J].科技进步与对策,2020,37(11):145-152. 被引量：1

1曾泽林,段明秀.基于密度的聚类算法DBSCAN的研究与实现[J].科技信息,2012(30):163-163. 被引量：3
2张晓.基于密度聚类算法的异常检测[J].伊犁师范学院学报（自然科学版）,2010,4(4):52-54. 被引量：6
3赵楠,刘振,孙艳超,邹盼盼,陈德军.基于密度聚类算法的学术资源热点发现方法研究[J].武汉理工大学学报（信息与管理工程版）,2016,38(6):721-725. 被引量：1
4胡昱璞,牛保宁.动态确定K值聚类算法的R-树空间索引构建[J].计算机科学与探索,2016,10(2):173-181. 被引量：3
5许虎寅,王治和.一种改进的基于密度的聚类算法[J].微电子学与计算机,2012,29(2):44-47. 被引量：20
6赵杰,杨柳.聚类分析算法dBscan的改进与实现[J].微电子学与计算机,2009,26(11):189-192. 被引量：14
7杨静,高嘉伟,梁吉业,刘杨磊.基于数据场的改进DBSCAN聚类算法[J].计算机科学与探索,2012,6(10):903-911. 被引量：21
8范敏,李泽明,石欣.一种基于区域中心点的聚类算法[J].计算机工程与科学,2014,36(9):1817-1822. 被引量：5
9易永红.数据挖掘聚类算法在船联网平台中的应用[J].舰船科学技术,2016,38(8X):148-150.
10姜建华,杨玉免,边海燕,康嘉容,王丽敏,刘颖.改进DBSCAN聚类算法在电子商务网站评价中的应用[J].吉林大学学报（理学版）,2016,54(2):329-336. 被引量：5

中国图象图形学报

2007年第11期

浏览历史

内容加载中请稍等...

一种改进的基于密度的抽样聚类算法被引量：4

参考文献10

共引文献11

同被引文献74

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

一种改进的基于密度的抽样聚类算法 被引量：4

参考文献10

共引文献11

同被引文献74

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

一种改进的基于密度的抽样聚类算法被引量：4