-
题名基于改进的FP-tree最大频繁模式挖掘算法
被引量:4
- 1
-
-
作者
宁慧
王素红
崔立刚
郭笑语
徐丽
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《应用科技》
CAS
2016年第2期37-43,共7页
-
基金
国家自然科学基金项目(61201084)
-
文摘
针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁模式完全集难以挖掘的问题,文中提出了IFPmax最大频繁模式挖掘算法,在改进的IFP-tree结构的基础上,利用结点的秩进行预判断,充分利用最大频繁模式的性质对已经存在的结点进行标记,有效避免了节点的冗余遍历,提高了最大频繁模式挖掘算法的效率。实验表明,在不同的基准数据集上文中提出的算法更有效,避免了节点的冗余遍历,使最大频繁模式挖掘算法效率更高。
-
关键词
挖掘
动态结点插入技术
ifp-tree
最大频繁模式
IFPmax
-
Keywords
mining
dynamic node insert technique
ifp-tree
maximal frequent patterns
IFPmax
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进的FP-树和数组技术的频繁模式挖掘算法
- 2
-
-
作者
孟志忠
-
机构
太原科技大学计算机科学与技术学院
-
出处
《电脑开发与应用》
2012年第9期43-45,51,共4页
-
文摘
FP-growth算法是目前较高效的频繁模式挖掘算法之一,该算法不产生候选项集,但递归构造"条件FP-Tree"的CPU开销和存储很大。为此提出了一种频繁模式挖掘算法IFPmine。首先,为了节省内存空间,采用了约束子树的挖掘方法;其次,采用了数组技术来减少树的遍历时间,从而提高算法的效率。实验结果表明,IFP算法是一种较有效的频繁模式挖掘算法,其挖掘效率优于树算法和树算法而需要的内存却少于树和树算法。
-
关键词
数据挖掘
关联规则
频繁模式
IFP-树
-
Keywords
data mining, association rules, frequent patterns, ifp-tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-