期刊文献+

基于Boost.Regex的网页信息抽取 被引量:1

下载PDF
导出
摘要 正则表达式是一种用于字符串模式匹配和替换的强有力工具。介绍了在VC++中如何配置Boost.Regex,实现基于正则表达式网页信息抽取类CHtmlcodeIE,从而完成了网页信息高效抽取。
出处 《电脑编程技巧与维护》 2009年第15期49-52,63,共5页 Computer Programming Skills & Maintenance
  • 相关文献

参考文献4

二级参考文献8

  • 1The Single UNIX Specification, Version 2 [OL].http://www. opengroup.org/onlinepubs/007908799/xbd/re.html
  • 2吕晓波.正则表达式使用详解[OL].http://dev.csdn.net/article/8/8254.shtm,.
  • 3SUN公司.The Java Tutorial[OL].http:http://ava.sun.com/docs/books/tutorial/index.html,.
  • 4程冲.基于Java平台的网络信息检索定题服务系统研究报告[Z].南京农业大学,2004..
  • 5[美]埃克尔(Eckel,B.)陈昊鹏 等译,Java编程思想,第3版,机械工业出版社,2005.
  • 6耿详义,张跃平,java2实用教程[M].清华大学出版社,2006[3].
  • 7闫宏飞,李晓明.关于中国Web的大小、形状和结构[J].计算机研究与发展,2002,39(8):958-967. 被引量:17
  • 8周源远,王继成,郑刚,张福炎.Web页面清洗技术的研究与实现[J].计算机工程,2002,28(9):48-50. 被引量:20

共引文献31

同被引文献5

引证文献1

二级引证文献39

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部