期刊文献+

Web页面爬行实践——.NET下正则表达式的应用 被引量:1

下载PDF
导出
摘要 本文首先对正则表达式做了一个整体的描述,接下来介绍.NET 对正则表达式的支持。在读者对正则表达式有了一定了解之后,应用这些知识实现一个类似 Webzip 的用来获取 Web 页面的简单的 Crawler。
作者 王辉
出处 《程序员》 2004年第9期112-114,共3页 Programmer
  • 相关文献

同被引文献7

  • 1许建潮,侯锟.Web信息的自主抽取方法[J].计算机工程与应用,2005,41(14):185-189. 被引量:15
  • 2王宁,王延章.一种半结构化数据采集系统的设计与实现[J].计算机应用与软件,2007,24(5):7-8. 被引量:1
  • 3杨曦 罗燕京 钟锋.面向垂直搜索引擎的一种动态网页的抓取方法.科技信息(学术研究),2008,(4).
  • 4Alberto H F Laender, BerthierA R ibeiro-Neto, Ahigran S daSilva, Juliana S Teixeira. A brief survey of Web data extraction tools[J]. ACM SIGMOD Record, 2002,31 (2) : 84 -93.
  • 5A. Pan et al. , Semi-automatic wrapper generation for commercial web sources, Proceedings of IFIP WGg. 1 Conference on Engineering Inform, Systems in the Internet Context (EISIC), 2002 : 265- 283.
  • 6A. Arasu, H. Garcia-Molina, Extracting structured data from web pages, in: Proceedings of the ACM SIGMOD International Conference on Management of Data, 2003:491-509.
  • 7Khare R,Cutting D, Sitaker K, Rifkin A. Nutch : A Flexible and Scalable Open-Source Web Search Engine . CommerceNet Labs : [CN- TR- 04- 04]. November 2004 : 1 - 12.

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部