基于聚类算法的大数据中密集数据算法分析被引量：1

下载PDF

导出

摘要大数据时代环境下如何能够计算海量密集型数据,研究提供了一个聚类算法的分析思路。基于MapReduce和SPRINT算法的编程框架,提出了一种决策树分类算法。通过实际实验对MR-DIDC算法的性能进行了一定量的测试,通过测试的结果来看,该算法具备良好的可扩展性以及较高的数据可用性。在数据量规模比较大的情况下,该算法大规模聚类的运行时间能够大量缩减。这类算法继承了MapReduce的优点,使该算法更适合大数据密集型数据的计算应用。

作者边文静 BIAN Wenjing

机构地区中国人民大学深圳研究院

出处《信息技术与信息化》 2021年第4期222-224,共3页 Information Technology and Informatization

关键词大数据数据挖掘算法

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1易月娥,林亚平,王永红.基于FP-tree挖掘密集型数据最大频繁模式算法[J].湖南城市学院学报（自然科学版）,2007,16(1):76-78. 被引量：2
2王萍,张际平.云计算与网络学习[J].现代教育技术,2008,18(11):81-84. 被引量：158
3杨志豪,赵太银,姚兴苗,李磊.一种适应数据与计算密集型任务的私有云系统实现研究[J].计算机应用研究,2011,28(2):621-624. 被引量：18
4梁娜,曾燕.推进数据密集科学发现提升科技创新能力:新模式、新方法、新挑战——《第四范式:数据密集型科学发现》译著出版[J].中国科学院院刊,2013,28(1):115-121. 被引量：22
5万鹏,黄方,赵伟彪,卜栓栓,董蕾,冯杰.基于云计算的并发访问密集型WebGIS QoS研究[J].地理信息世界,2013,20(4):20-26. 被引量：6

二级参考文献52

1ARMBRUST M, FOX A, GRIFFITH R, et al. Above the clouds: a Berkeley view of cloud computing, Technical Report UCB/EECS-2009-28[R].2009.
2EVANGLINOS C, CHRIS N H. Cloud computing for parallel scienti-fic HPC applications: feasibility of running coupled atmosphere-ocean climate models on Amazon’s EC2[C]//Proc of CCA’08.2008.
3LUIS M V, LUIS R M, CACERES J, et al. A break in the clouds: towards a cloud definition[J].ACM SIGCOMM Computer Communication Review,2009,39(1):50-55.
4Sun Microsystems Inc. Introduction to cloud computing architecture white paper[K].2009.
5吴朱华.从技术角度解剖云计算架构[EB/OL].(2010).http://www.infoq.com/cn/articles/analyze-cloud-architecture.
6DEAN J, GHEMAWAT S. MapReduce: simplified data processing on large clusters[C]//Proc of the 5th USENIX Symposium on Operating Systems Design and Implementation.2004:137-150.
7CitrixSystemsInc.XEN[EB/OL].(2010).http://www.xen.org/.
8SANJAY G, HOWARD G, SHUN T L. The Google file system[C]//Proc of the 17th ACM Symposium on Operating Systems Principles.2003:29-43.
9CHANG F, DEAN J, GHEMAWAT S, et al. Bigtable: a distributed storage system for structured data[C]//Proc of OSDI ’06. 2006:205-218.
10陈述彭鲁学军周成虎.地理信息系统导论[M].北京：科学出版社,2000..

共引文献201

1杨明芳,袁曦临.云计算环境下的数字图书馆[J].图书馆建设,2009(9):7-9. 被引量：104
2王娟,沈小平,叶萌.云计算在医疗卫生职业教育信息化发展中的应用探索[J].微型电脑应用,2011(3):42-44. 被引量：5
3王丽颖.浅析云计算对高校教学资源的影响[J].内蒙古石油化工,2011,37(8):151-153. 被引量：6
4冯凯,龙金花.基于云计算信息检索课程网络教学系统初探[J].南昌教育学院学报,2012,27(1):67-68. 被引量：3
5孟祥斌,李峰,吴晶.浅谈云计算在职业教育信息化中的应用[J].神州,2014(11):44-45. 被引量：2
6敖培,牟龙华.煤炭企业级电力云构建及电网规划应用实现[J].煤炭学报,2012,37(S1):252-257.
7杜俊.云计算环境下成人教育课程辅导的设计与实施——以“教学设计”课程为例[J].国家林业局管理干部学院学报,2010,9(3):49-51. 被引量：2
8杨娟.云计算在图书馆虚拟参考咨询服务中应用研究[J].黑龙江史志,2010(23).
9徐化祥.云计算对教育的影响初探[J].电脑知识与技术,2009,5(4):2690-2692. 被引量：37
10万利平,陈燕.云计算在教育信息化中的应用探究[J].中国教育信息化（高教职教）,2009(5):74-77. 被引量：92

同被引文献5

1宋蓓蓓.基于差分进化算法的网络多属性大数据聚类挖掘方法[J].宁夏师范学院学报,2021,42(1):91-97. 被引量：5
2蔡小爱,张海民.基于大数据的混合属性图像冗余特征聚类算法[J].合肥学院学报（综合版）,2021,38(5):96-101. 被引量：1
3陈晶,吴玲玲.多源异构环境下的车联网大数据混合属性特征检测方法[J].计算机科学,2022,49(8):108-112. 被引量：10
4李洁,许青,张露露,王英明.基于网格耦合的混合属性大数据聚类算法研究[J].信息工程大学学报,2022,23(2):218-223. 被引量：1
5古险峰,汤永利.基于群体智能算法的混合属性大数据聚类仿真[J].计算机仿真,2023,40(9):458-461. 被引量：1

引证文献1

1李志伟,侯敏杰.基于滑动窗口的混合属性大数据聚类算法[J].信息与电脑,2024,36(5):49-52.

1贺祥,刘磊,涂志莹,徐晓飞.多版本共存的微服务系统自适应演化方法[J].软件学报,2021,32(5):1341-1359. 被引量：2
2程翊珊,李治平,许龙飞,史华.预测油层无机积垢的BP神经网络方法[J].大庆石油地质与开发,2021,40(3):84-93. 被引量：8
3张建宏.高中物理实验数据处理中误差理论的应用[J].试题与研究（教学论坛）,2021(6):161-161.
4孙兆鹏,周宽久.基于PCIe的高性能FPGA-GPU-CPU异构编程架构[J].计算机工程与科学,2021,43(4):641-651. 被引量：7
5赵慧,张静.腔光力系统滤波输出光场的纠缠增强[J].量子光学学报,2021,27(1):1-7. 被引量：2

信息技术与信息化

2021年第4期

浏览历史

内容加载中请稍等...

基于聚类算法的大数据中密集数据算法分析被引量：1

参考文献5

二级参考文献52

共引文献201

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于聚类算法的大数据中密集数据算法分析 被引量：1

参考文献5

二级参考文献52

共引文献201

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于聚类算法的大数据中密集数据算法分析被引量：1