-
题名基于单向频繁模式树的频繁项集挖掘算法
被引量:3
- 1
-
-
作者
蒋东洁
李玲娟
-
机构
南京邮电大学计算机学院
-
出处
《计算机技术与发展》
2019年第10期175-180,共6页
-
基金
国家自然科学基金(61302158,61571238)
-
文摘
频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。
-
关键词
数据挖掘
频繁项集
单向频繁模式树
被约束子树
-
Keywords
data mining
frequent itemset
UFP-tree
constrained sub-tree
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-