期刊文献+

搜索引擎的文档预处理技术研究 被引量:2

The Research of Document Predisposition Technology in Search Engines
下载PDF
导出
摘要 搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询.设计搜索引擎的第一步就是对输入的各项进行规格化处理,使之标准化. In order to improve query speed of search engines.the searched page information from WWW must be predisposed,then store in the index database. This paper researched three aspects of documents predisposition (setting up may searched data structure .using stoplists and stemming).
出处 《计算机科学》 CSCD 北大核心 2002年第7期111-112,100,共3页 Computer Science
基金 云南省教育厅科学研究基金(项目编号:0112242)
关键词 搜索引擎 文档预处理 数据结构 网页标引 计算机网络 信息检索 Search engines .Documents predisposition,Stoplists.Stemming
  • 相关文献

参考文献2

  • 1Berry M W,Browne M. Understanding Search Engines Mathematical Modeling and Text Retrieval . Phlladephla : Society for industrical and Applied Mathematics(www . siam . org),1999
  • 2William B Frakes Ricardo Baeza-Yates . Information Retrieval.USA:Prentice Hall PTR, 1992

同被引文献8

引证文献2

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部