摘要
随着WorldWideWeb应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具有价值的信息源,但因Web所固有的开放性、动态性和异构性,又使用户很难准确快捷地从WWW上获取所需信息,为了解决这一问题提出了web数据挖掘这一概念。异构数据库环境和半结构化的数据结构是Web数据挖掘遇到的新问题。XML的出现为Web数据挖掘带来了契机。文中介绍了Web数据挖掘定义和分类,阐述了XML在Web挖掘中的重要作用,最后给出了一个基于XML的Web数据识别和抽取系统。
出处
《福建电脑》
2003年第8期63-64,共2页
Journal of Fujian Computer