期刊文献+

基于哈希表的MapReduce算法优化 被引量:4

Optimization on MapReduce algorithm based on Hash table
原文传递
导出
摘要 分布式并行计算是提高计算机性能常用的方法,但针对不同需求,并行程序的设计并没有统一的模型与方法,使得并行程序的编写完全依靠开发人员的经验。Google公司提出的分布式并行编程模型MapReduce能够完成特定类型的并行程序的开发与运行。使用哈希表对MapReduce分布式并行编程模型进行优化,减少中间结果中的碎片,并省略Combiner中间函数的调用,减少传输负载,提升运行效率,同时兼顾了Map函数与Reduce函数接口的属性,保持了MapReduce模型的并行性特点。 Distributed parallel computing is commonly used to improve computer performance. But according to different demands, there is not a uniform way to design and implement parallel program. Parallel programming depends on the experience of developer. MapReduce, a distributed parallel programming model, put forward by Google, can perform special parallel program development and operation. MapReduce was optimized by using Hash table, which would decrease fragment of Map function, skip other redundancy function such as Combiner function, reduce transmission load and improve computing efficiency. Meanwhile, the attributes of Map function and Reduce function were kept to make MapReduce maintaining parallel.
出处 《山东大学学报(理学版)》 CAS CSCD 北大核心 2015年第7期66-70,共5页 Journal of Shandong University(Natural Science)
基金 国家自然科学基金青年基金资助项目(61303209) 六安市定向委托皖西学院市级研究项目(2013LWA004) 安徽省教育厅重点项目(KJ2013A255)
关键词 分布式 并行 MAPREDUCE Map函数 哈希表 HADOOP distributed parallel MapReduce Map function Hash table Hadoop
  • 相关文献

参考文献13

二级参考文献119

  • 1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报(自然科学版),2011,39(S1):120-124. 被引量:79
  • 2周锋,李旭伟.一种改进的MapReduce并行编程模型[J].科协论坛(下半月),2009(2):65-66. 被引量:14
  • 3魏红宁.基于SPRINT方法的并行决策树分类研究[J].计算机应用,2005,25(1):39-41. 被引量:18
  • 4韩松来,张辉,周华平.基于关联度函数的决策树分类算法[J].计算机应用,2005,25(11):2655-2657. 被引量:36
  • 5宁焕生,张瑜,刘芳丽,刘文明,渠慎丰.中国物联网信息服务系统研究[J].电子学报,2006,34(B12):2514-2517. 被引量:151
  • 6VARIA J. Cloud architectures - Amazon Web services [ EB/OL]. [ 2009 - 03 - 01 ]. http://acmbangalore, org/events/monthly-talk/ may-2008 --cloud-architectures---amazon-web-services. html.
  • 7BRYANT R E. Data-intensive supercomputing: The case for DISC, CMU-CS-07-128 [ R]. Pittsburgh, PA, USA: Carnegie Mellon University, Department of Computer Science, 2007.
  • 8SZALAY A S, KUNSZT P, THAKAR A, et al. Designing and mining multi-terabyte astronomy archives: The sloan digital sky survey [ C]//Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 2000:451 - 462.
  • 9BARROSO L A, DEAN J, HOLZLE U. Web search for a planet: The Google cluster architecture [ J]. IEEE Micro, 2003, 23(2) : 22 -28.
  • 10GILES J. Google tops translation ranking [ EB/OL]. (2006 - 11 - 06) [ 2009 - 03 - 06 ]. http://www, nature, com/news/2006/ 061106/full/news061106-6. html.

共引文献1311

同被引文献29

引证文献4

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部