期刊文献+

大规模数据集聚类中的数据分区及应用研究 被引量:1

Application and Research of Data Partition in Large Scale Database During Clustering
下载PDF
导出
摘要 针对大型数据库提出了许多聚类方法,但是这些算法往往计算量较大、对主存的要求较高;而且当数据分布不均匀时,算法的聚类质量会受影响。因此为了提高聚类算法的效率和准确性,采用了数据分区技术首先对数据进行预处理,分区后的数据具有更少的数据量和更均匀的数据分布。 People raised many algorithms, but there are many disadvantages, for example, much computing especially in large scale database, demanding for large volume of memory support and so on. Furthermore clustering quality will be affected when the cluster density and the distance between clusters are not even. In order to improve the efficiency and quality ,this paper adopt pretreatment technology named data partition before clustering. After that, the number of data points is less and the distribution of data points is even.
出处 《计算机应用研究》 CSCD 北大核心 2007年第2期203-205,共3页 Application Research of Computers
基金 国家自然科学基金重大资助项目(60271019) 国家教育部基金资助项目(20020611007) 重庆市自然科学基金资助项目(8509)
关键词 数据挖掘 聚类 数据分区 并行聚类 Data Mining Cluster Data Partition Parallel Clustering
  • 相关文献

参考文献5

  • 1Khaled Alsabti,Sanjay Ranka.Vineet Singh:An Efficient K-means Clustering Algorithm[C].Proc.of the 1st Workshop on High-Performance Data Mining,1998.
  • 2Alex Tay Leng Phuan,Sandeep Prakash.K-means Fast Learning Artificial Neural Network,an Alternative Network for Classification[C].Proceedings of the 9th International Conference on Neural Information Processing(ICONIP'02),2002.925-929.
  • 3Martin Ester,Hans-Peter Kriegel,et al.A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C].Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining,1996.
  • 4周水庚,周傲英,曹晶,胡运发.一种基于密度的快速聚类算法[J].计算机研究与发展,2000,37(11):1287-1292. 被引量:89
  • 5周水庚,范晔,周傲英.基于数据取样的DBSCAN算法[J].小型微型计算机系统,2000,21(12):1270-1274. 被引量:27

二级参考文献11

  • 1周水庚.DBSCAN算法的扩展技术.复旦大学计算机科学系技术报告[M].,1999,4..
  • 2周水庚,复旦大学计算机科学系技术报告,1999年
  • 3Zhang W,Proceedings of the 23rd VLDB Conference,1997年,186页
  • 4Chen M S,IEEE Trans.KDE,1996年,8卷,6期,866页
  • 5Zhang T,Proceedings of the ACM SIG-MOD International Conference on Management of Data,1996年,103页
  • 6Ester M,Proceedings of 4th Int Symposiumon Large Spatial Databases,1995年,951卷,67页
  • 7Ng R T,Proceedings of the 20th VLDB Conference,1994年,144页
  • 8Zhang W,Proc 23rd VL DB Conf,1997年,186页
  • 9Chen M S,IEEE Trans Knowledge Data Engineering,1996年,8卷,6期,866页
  • 10Zhang T,Proc ACM SIGMOD Int Conf on Management of Data,1996年,73页

共引文献106

同被引文献6

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部