摘要
讨论如何使用Java实现抓取网络资源的网络蜘蛛。通过一个入口网址来扫描整个互联网的网址,并将这些扫描到的网址所指向的网络资源下载到本地,然后可以利用其他的分析工具对这些网络资源做进一步的分析。
Discusses how to crawl the Web resources using Java. It can scan the entire Website of the Internet by URL, and download those network resources, use other analytical tools to do further analysis.
出处
《现代计算机》
2009年第9期165-168,共4页
Modern Computer