期刊文献+

XWIS中基于预定义模式的包装器 被引量:3

SCHEMA-GUIDED WRAPPERS IN THE XWIS
下载PDF
导出
摘要 目前 ,从HTML文档中有效的抽取数据是一个值得研究的问题。文中提出了一种基于预定义模式的方法来构造HTML包装器 ,并将它运用到XWIS(基于XML的Web信息查询系统 )中。这种方法下 ,由用户定义模式并给出模式与HTML页面的映射关系 。 At present, effectively extracting data from HTML documents remains nontrivial task. In this paper, we presents a schema-guided approach to construct wrappers of HTML pages and implement it in the XWIS (XML-based Web Information Query System). Under this approach, the user defines a schema and provides sample mappings between the schema and the HTML page. The system will induce the mapping rules and then generate a wrapper.
出处 《计算机应用》 CSCD 北大核心 2001年第9期1-3,7,共4页 journal of Computer Applications
关键词 INTERNET 信息查询系统 XWIS 预定义模式 schema-guided wrapper HTML
  • 相关文献

参考文献3

  • 1王海燕 孟小峰 等.基于XML的Web信息查询系统XWIS:结构与实现[J].计算机科学,2000,27:22-25.
  • 2Liu L,Proceedings of the 16th Int Conference on Data Engineering(ICDE'2000),2000年
  • 3王海燕,计算机科学,2000年,27卷,增刊,22页

共引文献2

同被引文献23

  • 1郝亚南,陈少飞,李天柱,袁方.基于语义的数据格式转换[J].计算机系统应用,2004,13(11):40-43. 被引量:5
  • 2Arvind Arasu,Hector Garcia-Molina.Extracting structured data from web pages[R].Technical Report,Stanford University,2002
  • 3Alberto H F Laender,Berthier A Ribeiro-Neto.A Brief Survey of Web Data Extraction Tools[J].ACM SIGMOD Record,2002;31(2)
  • 4C Hsu,M Dung.Generating finite-state transducers for semistructured data extraction from the web[J].Information System,1998 ;23(8)
  • 5N Kushmerik.Wrapper induction:Efficiency and expressiveness[J].Artificial Intelligence ,2000;(118)
  • 6I Muslea,S Minton,C A Knobolock.A hierarchical approach to wrapper induction[C].In:Proc of Autonomous Agents,1999
  • 7S Soderland.Learning information extraction rules for semistructured and free text[J].Machine Learning,1999;34(1-3)
  • 8B Adelberg.NoDoSE-a tool for semi-automatically extracting structured and semistructured data from text documents.In SIGMOD 98
  • 9B A Ribeiro-Neto,A Laender.Extracting semistructured data through example.In CIKM 99
  • 10D W Embley,D M Campbell.A conceptual-modeling approach to extracting data from the web.In ER 98

引证文献3

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部