-
题名不确定数据流最大频繁项集挖掘算法研究
被引量:9
- 1
-
-
作者
刘慧婷
候明利
赵鹏
姚晟
-
机构
安徽大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2016年第19期72-77,93,共7页
-
基金
国家自然科学基金(No.61202227)
安徽省自然科学基金(No.1408085MF122)
-
文摘
对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研究。因此,针对上述不足,提出了一种基于衰减模型的不确定性数据流最大频繁项集挖掘算法TUFSMax。该算法采用标记树结点的方法,使得算法不需要超集检测就可挖掘出所有的最大频繁项集,节约了超集检测时间。实验证明了提出的算法在时间和空间上具有高效性。
-
关键词
不确定性数据流
最大频繁项集
超集检测
-
Keywords
uncertain data stream
maximum frequent items
super check
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-