期刊文献+

基于Web的网页信息抽取方法的研究 被引量:4

The Research of Web Pages Information Extraction Based on Web
下载PDF
导出
摘要 WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。本文介绍了一种基于Web的信息抽取的实现方法,能够按照规则模式重复地将半结构化网页中的信息自动抽取出来。 The rapid development of the World Wide Web makes it become more and more important sources for people to look for useful data. This paper introduces a method of information extraction from the Web, which can extract information by regulation pattern from semi-strnctured web pages repeatedly and automatically.
出处 《洛阳工业高等专科学校学报》 2005年第3期30-31,共2页 Journal of Luoyang Technology College
关键词 信息抽取 规则 模式 Information extraction Regulation Pattern
  • 相关文献

参考文献3

  • 1IonMuslea, Steve Minton, and Craig A.Knoblock. A hierarchical approach to wrapper induction[C].Proceedings of the Third International Conference on Autonomous Agents,Seattle,WA,1999.221-227.
  • 2G.Wiederhold. Mediators in the architecture of Future Information Systems [J].IEEE Computer, 1992,(3).
  • 3黄豫清,戚广志,张福炎.从WEB文档中构造半结构化信息的抽取器[J].软件学报,2000,11(1):73-78. 被引量:47

二级参考文献1

  • 1Ham mar J,SIGMOD Record,1997年,26卷,2期,18页

共引文献46

同被引文献41

引证文献4

二级引证文献97

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部