-
题名基于最频繁项提取和候选集剪枝的THIMFUP算法
被引量:5
- 1
-
-
作者
杨勇
张磊
曲福恒
刘俊杰
陈强
-
机构
长春理工大学计算机科学技术学院
长春师范大学教育学院
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2021年第3期635-642,共8页
-
基金
国家自然科学基金(批准号:41671397)
吉林省教育科学“十三五”规划项目(批准号:GH19086)。
-
文摘
针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库,并生成大量候选集的问题,提出一种通过提取数据库中最频繁项的方法,以降低对原频繁项集库的扫描次数;并通过候选集剪枝思想,减少算法整体运行过程中的候选集生成,以提高频繁项集的挖掘速度.实验结果表明,在相同实验条件下,该算法的效率比FBCM算法效率提高15%以上,最高达60%.
-
关键词
关联规则
增量挖掘
候选集剪枝
最频繁项
-
Keywords
association rule
incremental mining
candidate set pruning
most frequent item
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名支持多时间粒度的数据流上最频繁K项挖掘
被引量:1
- 2
-
-
作者
舒平达
陈华辉
-
机构
宁波大学信息科学与工程学院
-
出处
《宁波大学学报(理工版)》
CAS
2009年第4期500-505,共6页
-
文摘
数据流最频繁K项挖掘是指在数据流中找出K个项,它们的支持数大于数据流中的其他项.已有的一些算法只能挖掘整个数据流的频繁K项,而无法找出距离最近的任意时间段内的最频繁K项.因此,提出一种基于多层概要结构的数据流最频繁K项挖掘算法MMF(K)_MS,新算法利用各层节点数目可变的HFVN框架结构来支持对不同时间粒度的查询,同时采用Count-Sketch数据结构来维护各层的概要信息,并通过实验验证了算法的有效性.
-
关键词
数据流
数据挖掘
最频繁K项
-
Keywords
data streams data mining most frequent K items
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-