期刊文献+

一种自动化的网页数据抽取方法 被引量:1

An Automatic Method of Data Abstract from Web Pages
下载PDF
导出
摘要 数据抽取是当前网络飞速发展的背景下衍生的一类技术。简单介绍了数据抽取技术的发展和研究现状,并针对目前数据抽取技术的不足提出了一种新的数据抽取方法,能够自动化地并高准确度地从网页上抽取数据。 Data abstract is a kind of technology which derives from the rapid development of network. The development and research state of data abstract are described, and a new method of data abstract is proposed based on the shortcomings of current data abstract technology, which can abstract data from Web pages automatically and veraciously.
出处 《科学技术与工程》 2006年第14期2174-2176,共3页 Science Technology and Engineering
关键词 数据抽取 等价类 WRAPPER data abstract equivalence class Wrapper
  • 相关文献

参考文献5

  • 1[3]Arasu A,Garcia-Molina A.Extracting structured data from Web pages.ICDE,2003:698-698
  • 2[4]Buttler D,Liu Ling,Pu Calton.A fully automated object extraction system for the world wide Web.ICDCS,2001:361-370
  • 3[5]Crescenzi V,Mecca G.On automatic information extraction from large Web sites.Technical Report.DIA-76-2003
  • 4[6]Kushmerick N.Wrapper induction:efficiency and expressi veness.Artificial Intelligence 2000; 118(1-2):15-68
  • 5[7]Alberto H F,Laender B A,Ribeiro-Neto,et al.A brief survey of Web data extraction tools.SIGMOD Record,2002; 31 (2):84-93

同被引文献4

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部