摘要
大数据中Hadoop和Apache Spark这两个名字大家并不陌生。但往往对它们的理解只是提留在字面上,并没有对它们进行深入的思考。首先,Hadoop和Apache Spark两者都是大数据框架,但是各自存在的目的不尽相同。Hadoop实质上更多是一个分布式数据基础设施:它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储.意味着您不需要购买和维护昂贵的服务器硬件。同时,Hadoop还会索引和跟踪这些数据,让大数据处理和分析效率达到前所未有的高度。
出处
《电脑编程技巧与维护》
2016年第2期4-4,共1页
Computer Programming Skills & Maintenance