期刊文献+

基于Hadoop的信息检索系统研究 被引量:4

Research on Hadoop-based Information Retrieval System
下载PDF
导出
摘要 [目的/意义]探讨分布式信息检索系统设计,解决大数据背景下传统信息检索系统效率低下而不能满足检索需求的问题。[方法/过程]从Hadoop框架着手,探讨基于Hadoop的分布式信息检索系统,提出改进构想,并通过实验验证其可行性。[结果/结论]提出对输入数据流采用预处理方式替代批处理方式的构想,实验验证了该构想的可行性。Hadoop框架已成功应用于多个领域,但是其中的Map Reduce算法及算法效率优化有待研究。 [Purpose/significance] The paper is to discuss design of distributed information retrieval system, to solve the problem of traditional information retrieval system's can't satisfying the requirements of people's needs due to its low efficiency in the context of big data.[Method/process] The paper begins with Hadoop framework to discuss Hadoop-based distributed information retrieval system, put forward some ideas of improvements, and verifies its feasibility through experiment. [Result/conclusion]The paper proposes the ideas of using pretreatment mode instead of batch mode for input data stream, and verifies its feasibility by experiment. The Hadoop framework has been successfully applied in many fields, but the Map Reduce algorithm and algorithm efficiency optimization in it remains to be studied.
作者 孙永超
出处 《情报探索》 2016年第8期125-130,共6页 Information Research
关键词 HADOOP MAPREDUCE 分布式处理 信息检索 键值对 Hadoop Mapreduce distributed processing information retrieval key-value pairs
  • 相关文献

参考文献7

  • 1BAEZA-YATES R,RIBEIRO-NETO B. Modem in- formation retrieval[M]. New York : ACM press, 1999 : 1.
  • 2TOM W.Hadoop权威指南[M].3版.华东师范大学数据科学与工程学院.译.北京:清华大学出版社,2015:23-25.
  • 3Khaled Tannir.Hadoop Mapreduce性能优化[M].范欢动.译.北京:人民邮电出版社,2015:3-5.
  • 4蔡斌,陈湘萍.Hadoop技术内幕[M].北京:机械工业出版,2013:216-217.
  • 5LESKOVEC J.大数据:互联网大规模数据挖掘与分布式处理[M].王斌,译.北京:人民邮电出版社,2015:21.
  • 6万川梅,谢正兰.深入云计算:Hadoop应用开发实战详解[M].北京:中国铁道出版社,2013:1-59.
  • 7亓开元,赵卓峰,房俊,马强.针对高速数据流的大规模数据实时处理方法[J].计算机学报,2012,35(3):477-490. 被引量:95

共引文献99

同被引文献32

引证文献4

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部