期刊文献+

基于聚类算法的大数据中密集数据算法分析 被引量:1

下载PDF
导出
摘要 大数据时代环境下如何能够计算海量密集型数据,研究提供了一个聚类算法的分析思路。基于MapReduce和SPRINT算法的编程框架,提出了一种决策树分类算法。通过实际实验对MR-DIDC算法的性能进行了一定量的测试,通过测试的结果来看,该算法具备良好的可扩展性以及较高的数据可用性。在数据量规模比较大的情况下,该算法大规模聚类的运行时间能够大量缩减。这类算法继承了MapReduce的优点,使该算法更适合大数据密集型数据的计算应用。
作者 边文静 BIAN Wenjing
出处 《信息技术与信息化》 2021年第4期222-224,共3页 Information Technology and Informatization
  • 相关文献

参考文献5

二级参考文献52

  • 1ARMBRUST M, FOX A, GRIFFITH R, et al. Above the clouds: a Berkeley view of cloud computing, Technical Report UCB/EECS-2009-28[R].2009.
  • 2EVANGLINOS C, CHRIS N H. Cloud computing for parallel scienti-fic HPC applications: feasibility of running coupled atmosphere-ocean climate models on Amazon’s EC2[C]//Proc of CCA’08.2008.
  • 3LUIS M V, LUIS R M, CACERES J, et al. A break in the clouds: towards a cloud definition[J].ACM SIGCOMM Computer Communication Review,2009,39(1):50-55.
  • 4Sun Microsystems Inc. Introduction to cloud computing architecture white paper[K].2009.
  • 5吴朱华.从技术角度解剖云计算架构[EB/OL].(2010).http://www.infoq.com/cn/articles/analyze-cloud-architecture.
  • 6DEAN J, GHEMAWAT S. MapReduce: simplified data processing on large clusters[C]//Proc of the 5th USENIX Symposium on Operating Systems Design and Implementation.2004:137-150.
  • 7CitrixSystemsInc.XEN[EB/OL].(2010).http://www.xen.org/.
  • 8SANJAY G, HOWARD G, SHUN T L. The Google file system[C]//Proc of the 17th ACM Symposium on Operating Systems Principles.2003:29-43.
  • 9CHANG F, DEAN J, GHEMAWAT S, et al. Bigtable: a distributed storage system for structured data[C]//Proc of OSDI ’06. 2006:205-218.
  • 10陈述彭 鲁学军 周成虎.地理信息系统导论[M].北京:科学出版社,2000..

共引文献201

同被引文献5

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部