-
题名基于优化的FP-Tree的频繁闭合项集挖掘算法
- 1
-
-
作者
颜伟
苏兆锋
周钦亮
-
机构
曲阜师范大学信息网络中心
鲁东大学管理学院
上海市徐汇区漕河泾高新区mettier toledo
-
出处
《曲阜师范大学学报(自然科学版)》
CAS
2009年第2期57-61,共5页
-
文摘
在经典的频繁闭合项集挖掘算法中,如Closet与Closet+,当条件模式数据库很庞大时,频繁项集的数目将会急剧增长,算法的效率会逐步恶化,并且算法挖掘结果的有效性也随着大量冗余模式的产生而下降.本文首先针对传统的FP-tree的算法,给出了一种改进的FP-tree算法,然后在新算法的基础上,提出新的频繁闭合项集挖掘算法,该算法只需把FP-Tree中所有由叶子结点到根结点的路径遍历一遍,就可以得到各项的所有子条件模式基,避免了传统FP-tree算法在同一条路径上向前回溯比较的繁琐.实验表明优化后的算法避免了资源的耗费,减少了频繁闭合项集挖掘的运算开销,大大提高了数据挖掘的效率.
-
关键词
数据挖掘
闭合项集
频繁模式增长
-
Keywords
data mining
closed itemsets
FP-growth
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-