期刊文献+

基于Hadoop架构的大数据量日志存储和检索优化 被引量:3

A Lot of Log Storage and Retrieval Optimization based on Hadoop Architecture
下载PDF
导出
摘要 Hadoop是一个实现MapReduce计算模型的开源分布式并行编程框架,借助于Hadoop,程序员可以轻松编写分布式并行程序,并将其运行于计算机集群上,完成海量数据的计算。本文介绍了基于Hadoop架构的系统的设计与实现,介绍如何提高Hadoop的分布式文件管理系统(HDFS)和MapReduce的执行效率与速度,以及Hadoop的安装部署和基本运行方法。 Hadoop is an open-source distributed parallel programming architecture that realized MapReduce computing model. By using Hadoop, programmers can write distributed parallel program easily and complete the calculation of the vast amounts of data by applying it to computer cluster. This article introduces Hadoop system design and implementation, how to improve the execution efficiency and speed of HDFS and MapReduce, and the deployment method of Hadoop.
出处 《信息网络安全》 2013年第6期40-45,共6页 Netinfo Security
关键词 HADOOP 分布式计算 日志 Hadoop distributed computing log
  • 相关文献

参考文献7

  • 1周海汉.HBase[EB/OL].http://hbaseapache.org,2013.04-07.
  • 2Sanjay Ghemawat, Howard Gobioff, Shun-Tak Leung. TheGoogle File System[F.B/OL].http://labs.google.com/pctpers/gfs-sosp2003. pdf, 2011-03-29.
  • 3怀特著.周敏奇,钱卫宁,金澈清,王晓玲译.Hadoop权威指南(第2版)[M].北京:清华大学出版社,2011.
  • 4guiii.hadoop作业调优参数整理及原理[EB/OL].http://www.tbdata.0rq/0rchjves/1470,2011-01-20.
  • 5Dhruba BOrthakur & Joydeep Sen Sarma etc.Apache Hadoop Goes Reaitime clt Facebook[EB/OL].http://wenku.baidu.com/ view/5blf48ef0975f46527d3e18b.html , 2011-06-12.
  • 6拉姆著.韩冀中译.Hadoop实战[M].北京:人民邮电出版社,2011.
  • 7Sumit Shrestha.Bulk importing Data into HBase[FTB/OLt.http://www. deerwalk.com/bulk importing_data, 2011-07-26.

同被引文献20

引证文献3

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部