期刊文献+

大规模搜索引擎检索系统框架与实现要点 被引量:20

On the Design and Implementation of the Retrieval System of a Large-Scale Search Engine
下载PDF
导出
摘要 随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构,并分析了索引创建和索引检索中的相关实现技术。 With the flourish of the Web, search engine becomes one of the most popular applications on the Internet. In this paper, we analyze the design and implementation of Tianwang, which is a large-scale general Chinese search engine. Based on the principle of efficiency and effectiveness, we describe the integrated retrieval system framework and the distributed retrieval architecture of Tianwang. Then we analyze the technical details in the index creation and index retrieval, which lead to a high-performance search engine retrieval system.
作者 彭波
出处 《计算机工程与科学》 CSCD 2006年第3期1-4,共4页 Computer Engineering & Science
基金 国家973计划资助项目(G1999032706) 教育部博士点基金课题(20030001076)
关键词 搜索引擎 信息检索 天网 search engine information retrieval Tianwang
  • 相关文献

参考文献15

  • 1S Brin,L Page.The Anatomy of a Large-Scale Hypertexual Web Search Engine[A].Proc of the 7th WWW Conf[C].1998.
  • 2天网.北京大学天网中英搜索引擎[EB/OL].http://e.pku.edu.cn,2003-10.
  • 3YAN Hongfei,WANG Jianyong,LI Xiaoming.A Dynamically Reconfigurable Model for a Distributed Web Crawling System[A].2001 Int'l Conf on Computer Networks and Mobile Computing[C].2001.157-162.
  • 4YAN Hongfei,WANG Jianyong,LI Xiaoming,et al.Architectural Design and Evaluation of an Efficient Web-Crawling System[J].Journal of System and Software,2002,60(3):185-193.
  • 5王建勇,单松巍,雷鸣,谢正茂,李晓明.海量Web搜索引擎系统中用户行为的分布特征及其启示[J].中国科学(E辑),2001,31(4):372-384. 被引量:45
  • 6冯是聪,张志刚,李晓明.一种中文网页自动分类方法的实现及应用[J].计算机工程,2004,30(5):19-20. 被引量:15
  • 7天网知名度[EB/OL].http://net.cs.pku.edu.cn/~fame/,2003-10.
  • 8雷鸣,王建勇,陈葆珏,李晓明.Improved Relevance Ranking in WebGather[J].Journal of Computer Science & Technology,2001,16(5):410-417. 被引量:4
  • 9I H Witten,A Moffat,T C Bell.张仲颖,曹文斌,曹永革译.海量数据管理-文档和图像的压缩与索引[M].北京:科学出版社龙门书局,1996.
  • 10A Moffat,J Zobel.Self-Indexing Inverted Files for Fast Text Retrieval[J].ACM Trans on Information Systems,1996,14(4):349-379.

二级参考文献9

共引文献60

同被引文献79

引证文献20

二级引证文献49

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部