摘要
XML数据的灵活性、自描述性以及可扩展性使得越来越多的领域开始采用它作为主要的存储格式和传输媒介,因而产生了大量的XML数据,积累了丰富的信息。但是XML表述的数据特点比较复杂,这就为数据挖掘人员提出了新的挑战。文章从表述XML数据的模型开始介绍,按照模型对XML关联挖掘算法进行分类,介绍了主要的一些算法,并探讨了目前存在的问题和主要的发展方向。
The flexibility, self-description and expansibility of XML data has made it develop dramatically and become a major standard for storing and exchanging information. The increasing amount of available XML data and complexi-ty of characteristics of XML data pose new challenges to the data mining community. This paper first introduces the data model presenting XML data, then describes the main algorithm of Mining XML Association Rules classified data model, and finally exolores the main oroblem now and develoo direction future.
出处
《计算机科学》
CSCD
北大核心
2004年第10期23-27,共5页
Computer Science
基金
国家863项目(2002AA412020)
江苏省自然科学基金(NO.BK200204)的资助