期刊文献+

一个Web抓取器的实现

An Implementation of Web Grabber
下载PDF
导出
摘要 本文介绍一个Web抓取器的实现。Web抓取器能够根据用户输入的URL和一定的约束条件自动地搜索Web上的超文本文档 ,建立URL索引 ,根据该索引有选择的下载Web资源 ,同时保持了原有的链接关系。本文实现了一种Web遍历过程 ,并根据遍历结果抓取文档 ,从而完成对指定URL抓取文本。 This paper introduces an implementation of Web grabber. The primary purpose of the Web grabber is to fetch hypertext documents according to the given URL and some restrictions. After specifying the options, our program will fetch the start Web document, extract the links from document.Having traveled the URLs,it will finally download the hyperlinked documents.The authors analyse an implementation of such a Web grabber. After presenting a scheme of Web crawling,this paper describes the details of fetching Web documents according to the result of crawling . [
出处 《微机发展》 2001年第1期32-35,共4页 Microcomputer Development
关键词 WEB抓取器 超文本文档 URL INTERNET Web Grabber Hypertext Document UR4
  • 相关文献

参考文献1

  • 1(美)Kris Jamsa 刘素丽等(译).INTERNET编程[M].电子工业出版社,1995,5..

共引文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部