-
题名挖掘数据流中的频繁模式
被引量:25
- 1
-
-
作者
刘学军
徐宏炳
董逸生
王永利
钱江波
-
机构
东南大学计算机科学与技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第12期2192-2198,共7页
-
基金
江苏省高技术基金项目(BG2004034)
江苏省2004年度研究生创新计划基金项目(xm04-36)~~
-
文摘
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能·
-
关键词
数据流
频繁模式
fp—ds算法
流数据挖掘
-
Keywords
data streams
frequent patterns
fp-ds algorithm
stream data mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-