摘要
作为一种新的数据形态,流数据对数据挖掘提出了诸多挑战。学者们已提出大量处理流数据的挖掘算法。本文对这些算法进行了综述。首先介绍了多个不同的数据流模型,这些模型对算法设计有着不同的要求。然后,总结了流数据挖掘算法的特点,并给出了算法中常用的技术。最后,分析了各个流数据挖掘任务中的代表性算法。
Data streams pose great challenges to data mining. Many stream data mining algorithms have been proposed. In this paper, we give an overview of these algorithms. Firstly, the data stream models are introduced. Then the characters of stream data mining algorithms are summarized and several techniques that are used in these algorithms are introduced. At last, the representative algorithms of every mining task are analyzed.
出处
《计算机科学》
CSCD
北大核心
2007年第1期1-5,11,共6页
Computer Science
基金
湖北省自然科学基金项目"时空数据库的关键技术研究与实验"(ABA048)的资助
关键词
数据流
数据挖掘
时空复杂度
滑动窗口
Data stream, Data mining, Time-space complexity, Sliding window