期刊文献+

基于XML的Web信息提取技术研究 被引量:1

Study on Web Information Extraction Technology Based on XML
下载PDF
导出
摘要 研究Web信息提取技术,提出数据获取、规则定义和规则执行3个步骤的基于XML的半结构化Web信息提取方法,为进一步满足Web信息提取提供了一种高效的新方法。 Studies on extraction technology of Web information extraction technology, proposes data acquisition, definition of rules and rules administer for the object-based half-structured of Web information extraction based on XML, provides efficient methods for the further information extraction.
出处 《现代计算机》 2007年第8期29-30,共2页 Modern Computer
关键词 WEB XML 半结构化 信息提取 Web XML Half-Structured Information Extraction
  • 相关文献

参考文献6

二级参考文献43

  • 1徐振航,刘莉芹.XML与面向Web的数据挖掘技术[J].软件世界,2000(10):120-122. 被引量:16
  • 2Jackson J Myllymaki J.基于Web的数据挖掘:自动抽取用HTM、XML和Java编写的信息[J/0L].http://www.IBM.com.2001.6.,.
  • 3孟小峰.数据挖掘走向Internet .微电脑世界,2001,(52).
  • 4Mobasher B,Jain N,Han E H,Srivastava J. 1996, Web Mining: Pattern Discovery from World Wide Web Transactions[ R]. Technical Report 96 - 050,1996.
  • 5Jussi Myllymak.Effective Web Data Extraction with standard XML Technologies.http://www.research.ibm.com/people/j/jussi/papers/ANDES/ANDES.pdf.
  • 6Raymond Kosala,Heodrid Blocked.Web Mining Research :A Survey.ACM SIGKDD,2000-07.
  • 7Oualnid H,Karmouch A.Converting Web pages into well-formed XML documents.Communications,1999,ICC'99,1999 IEEE International Conference on,1999; 1:676~680.
  • 8W3C.Extensible Markup Language(XML).http://www.w3.org/xml/156 2004.10计算机工程与应用.
  • 9W3C.Resource Description Framework(RDF) Schema Specification 1.0.http://www.w3.org/TR/2000/CR-rdf-schema20000327,2000-03-27.
  • 10Stefan Haustein.Utilisting an Ontology Based Repository to Connect Web Miners and Application Agents.http://www-ai.cs.uni-dortmund.de.

共引文献162

同被引文献8

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部