期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Hadoop云计算平台的海量文本处理研究 被引量:11
1
作者 张学亮 陈金勇 陈勇 《无线电通信技术》 2014年第1期54-57,共4页
针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词... 针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词索引,并提供实时检索,实现对海量文本数据的分布式并行处理。实验结果表明,Hadoop框架为大规模数据的分布式并行处理提供了很好的解决方案。 展开更多
关键词 海量文本处理 HADOOP HDFS HBASE MAPREDUCE 分布式并行处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部