-
题名基于Java的多线程网络爬虫设计与实现
被引量:7
- 1
-
-
作者
姜梦稚
-
机构
上海电机学院电子信息学院
-
出处
《微型电脑应用》
2010年第7期21-22,4-5,共2页
-
文摘
网络爬虫是目前比较流行的一种网页检索工具,其设计和实现也需要不断优化和改进。通过描述网络爬虫设计与实现中所碰到的问题,提供解决这些问题的方法,并给出实现这些目标的网络爬虫设计方法,提供该设计的Java语言版实现。
-
关键词
网络爬虫
链接检索
文字匹配
爬虫设计
多线程
-
Keywords
Web Crawler
Link Searching
Word Match
Crawler Design
Multiple-threaded
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-
-
题名目前互联网中的网络爬虫的原理和影响
- 2
-
-
作者
赵鑫炜
-
机构
四川大学锦城学院计算机与软件学院
-
出处
《数码设计》
2019年第5期50-52,共3页
-
文摘
网络爬虫(Web Crawler)是目前的网络环境中非常主流的的一种获取互联网中有效目标信息的一种技术,爬虫设计和实现已经十分成熟.爬虫的出现给当代互联网带来了巨大的影响,同时也出现在爬虫技术应用上的利弊体现.通过描述爬虫应用的出现的利弊现象,分析其中原理和原因,并给其中爬虫设计方法,及其基于java语言的分析.
-
关键词
网络爬虫
链接检索
文字匹配
爬虫设计
JAVA
多线程
-
Keywords
web crawler
link retrieval
text matching
crawler design
java
multithreading
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-