-
题名基于最频繁项提取和候选集剪枝的THIMFUP算法
被引量:5
- 1
-
-
作者
杨勇
张磊
曲福恒
刘俊杰
陈强
-
机构
长春理工大学计算机科学技术学院
长春师范大学教育学院
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2021年第3期635-642,共8页
-
基金
国家自然科学基金(批准号:41671397)
吉林省教育科学“十三五”规划项目(批准号:GH19086)。
-
文摘
针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库,并生成大量候选集的问题,提出一种通过提取数据库中最频繁项的方法,以降低对原频繁项集库的扫描次数;并通过候选集剪枝思想,减少算法整体运行过程中的候选集生成,以提高频繁项集的挖掘速度.实验结果表明,在相同实验条件下,该算法的效率比FBCM算法效率提高15%以上,最高达60%.
-
关键词
关联规则
增量挖掘
候选集剪枝
最频繁项
-
Keywords
association rule
incremental mining
candidate set pruning
most frequent item
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于候选项集剪枝的Apriori算法的研究
被引量:4
- 2
-
-
作者
韩天鹏
白玲玲
王浩
-
机构
阜阳师范学院计算机与信息工程学院
中共阜阳市委党校信息管理中心
-
出处
《阜阳师范学院学报(自然科学版)》
2014年第4期79-83,共5页
-
基金
安徽省重点研究基地项目(SK2012B625)资助
安徽省专业综合改革试点项目(2013zy167)
阜阳师范学院专业综合改革试点项目(2013ZYSD05)
-
文摘
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。
-
关键词
事务压缩
候选集剪枝
关联规则
APRIORI算法
-
Keywords
transaction compression
candidate sets pruning
association rules
Apriori algorithm
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
-