Web页面爬行实践——.NET下正则表达式的应用
被引量:1
摘要
本文首先对正则表达式做了一个整体的描述,接下来介绍.NET 对正则表达式的支持。在读者对正则表达式有了一定了解之后,应用这些知识实现一个类似 Webzip 的用来获取 Web 页面的简单的 Crawler。
出处
《程序员》
2004年第9期112-114,共3页
Programmer
同被引文献7
-
1许建潮,侯锟.Web信息的自主抽取方法[J].计算机工程与应用,2005,41(14):185-189. 被引量:15
-
2王宁,王延章.一种半结构化数据采集系统的设计与实现[J].计算机应用与软件,2007,24(5):7-8. 被引量:1
-
3杨曦 罗燕京 钟锋.面向垂直搜索引擎的一种动态网页的抓取方法.科技信息(学术研究),2008,(4).
-
4Alberto H F Laender, BerthierA R ibeiro-Neto, Ahigran S daSilva, Juliana S Teixeira. A brief survey of Web data extraction tools[J]. ACM SIGMOD Record, 2002,31 (2) : 84 -93.
-
5A. Pan et al. , Semi-automatic wrapper generation for commercial web sources, Proceedings of IFIP WGg. 1 Conference on Engineering Inform, Systems in the Internet Context (EISIC), 2002 : 265- 283.
-
6A. Arasu, H. Garcia-Molina, Extracting structured data from web pages, in: Proceedings of the ACM SIGMOD International Conference on Management of Data, 2003:491-509.
-
7Khare R,Cutting D, Sitaker K, Rifkin A. Nutch : A Flexible and Scalable Open-Source Web Search Engine . CommerceNet Labs : [CN- TR- 04- 04]. November 2004 : 1 - 12.
-
1下载软件龙虎榜[J].程序员,2000,0(9):48-49.
-
2WebZip[J].视窗世界,2004(2):117-117.
-
3顾剑.离线浏览器WebZIP下载实战[J].网迷,2000(4):55-57.
-
4葛亚伟.撬开在线压缩文件的秘密[J].电脑爱好者,2009(9):41-41.
-
5何广.巧用WebZIP离线浏览[J].微电脑世界,2000(29):59-60.
-
6离线浏览器WebZIP教程[J].Internet信息世界,2000(4):70-71.
-
7周勇生.WEBZIP完全上手使用指南[J].网络与信息,2000,14(7):62-63.
-
8周勇生.WEBZIP完全上手使用指南[J].电脑,2000(6):43-44.
-
9王锐.用WebZip把喜欢的网站拽下来[J].网络与信息,2003,17(5):75-75.
-
10棒棒虎.把网站搬回硬盘:离线浏览WebZip应用详解[J].移动信息.新网络,2001(3):31-33.