期刊文献+

全文搜索引擎e_Guide的设计与实现

下载PDF
导出
摘要 面对互联网信息量爆炸式的增长,人们对搜索引擎的需求和依赖越来越强,因此对搜索引擎技术的研究具有非常重要的理论意义和实用价值。本文描述全文搜索引擎e_Guide的设计和实现。e_Guide是基于Apache Lucene项目及其子项目Nutch和Hadoop的搜索引擎,致力于向用户提供高质量的信息检索服务。整个系统主要分为信息获取模块,信息整理模块,和搜索服务模块。使用Nutch获取网页信息,用Lucene API进行信息索引和检索,同时使用AJAX实现浏览器服务器之间的异步交互。
作者 赵晓
出处 《电子商务》 2013年第11期59-59,66,共2页 E-Business Journal
  • 相关文献

参考文献3

二级参考文献27

  • 1Cho J, Garcia-Molina H, Page L. Efficient crawling through URL ordering [J]. Computer Networks, 1998, 30 (1-7): 161-172.
  • 2Chakrabarti S,van den Berg M,Dom B. Focused crawling: a new approach to topic-specific Web resource discovery [J].Computer Networks, 1999,31(11-16):1623-1640.
  • 3Rennie J,McCallum A. Using reinforcement learning to spider the Web efficiently[C]. In: Proc of the International Conference on Machine Learning(ICML 99),1999.
  • 4Aggarwal C, AI-Garawi F, Yu S P. Intelligent crawling on the World Wide Web with arbitrary Predicates[C]. In: Proc of the 10th International World Wide Web Conference,2001.
  • 5Menczer F. Complementing search engines with online Web mining agents[J]. Decision Support Systems,2003,35(2):195-212.
  • 6Najork M, Wiener J L. Breadth-first search crawling yields high-quality pages [C]. In: Proc of the 10th International World Wide Web Conference, 2001,114-118.
  • 7Bra D P, Houben G, Kornatzky et al. Information retrieval in distributed hypertexts[C]. In: Proc of the 4th RIAO Conference, 1994,481-491.
  • 8Hersovici M, Heydon A, Mitzenmacher M, et al. The sharksearch algorithm-An application: Tailored Web site mapping[C]. World-Wide Web Conference, 1998.
  • 9Srinivasan P,Pant G,Menczer F. Target seeking crawlers and their topical performance[C]. In: Proc of SIGIR Conference on Research and Development in Information Retrieval, ACM press,2002.
  • 10Brin S,Page L. The anatomy of a large-scale hypertextual Web search engine [J]. Computer Networks, 1998, 30 (1-7):107-117.

共引文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部