摘要
海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。
Mass data processing is a focal point of information techniques. This paper introduces architecture of open source parallel system - Hadoop, analyzes the MapReduce programming framework based on Hadoop, and proposes a method for generating co - occurrence matrix of mass data through multiple MapReduce operations.
出处
《现代图书情报技术》
CSSCI
北大核心
2009年第4期23-26,共4页
New Technology of Library and Information Service
基金
国家"十一五"科技支撑计划子课题"网络科技信息监测与评价"(项目编号:2006BAH03B05)的研究成果之一