期刊文献+

一种基于XML的Web内容挖掘预处理方法

A Pre-processing Method for Web Content Mining Based on XML
下载PDF
导出
摘要 Web数据挖掘技术是近年来数据挖掘领域的研究重点之一。由于Web文档具有半结构化的特点,在执行具体的挖掘操作之前,对Web文档进行预处理是必不可少的。文章针对Web内容挖掘的预处理过程,提出一种以XML作为中介语言进行数据预处理的方法。 Web data mining technology is one of the hottest research topics in the field of data mining in recent years.Due to the characteristics of semi-structured Web document,the pre-processing is essential for it before executing specific mining operations.Aiming at the pre-processing process of Web content mining,we propose a pre-processing method that uses XML as an inter-language for data pre-processing.
作者 梁娟 陈智
出处 《计算机时代》 2011年第6期45-46,48,共3页 Computer Era
关键词 WEB内容挖掘 XML 预处理 WEB文档 Web content mining XML pre-processing Web document
  • 相关文献

参考文献11

二级参考文献65

  • 1王小虎.数据仓库设计[J].四川工业学院学报,2004,23(2):43-44. 被引量:1
  • 2王静,孟小峰,王珊.基于区域划分的XML结构连接[J].软件学报,2004,15(5):720-729. 被引量:35
  • 3孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,15(12):1822-1836. 被引量:176
  • 4马宏伟.数据挖掘在网络信息中的应用[J].情报探索,2005(2):83-85. 被引量:5
  • 5苏云,马慧芳.基于Web的信息过滤技术[J].情报杂志,2005,24(5):72-73. 被引量:12
  • 6Kusumura Y,Hijikata Y,Nishida S.Extracting fixed information from miscellaneous documents on net auction[C]//17th International Conference on Advanced Information Networking and Applications, AINA 2003:446-453.
  • 7Doorendos R B,Etzioni O, Weld D.A scalable comparison-shopping agent for the world-wide Web[C]//Proc of the 1st International Conference on Autonomous Agents,ACM, 1997.
  • 8Laender A H F,Ribeiro-Neto B A,da Silva A S.A brief survey of Web data extraction tools[J].ACM SIGMOD Record,2002,31 (2): 84-93.
  • 9Wang Ya-lin,Hu Jian-ying.Detecting tables in Web documents[C]// LNCS 2423 : DAS 2002,2002: 249-260.
  • 10Krupl B,Herzog M,Gatterbauer W.Using visual cues for extraction of tabular data from arbitrary HTML documents[C]//Proceedings of the 14th Int'l Conf on World Wide Web,WWW2005,ACM,2005: 1000-1001.

共引文献146

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部