-
题名基于FP-tree最大频繁模式超集挖掘算法
被引量:3
- 1
-
-
作者
王君
任永功
-
机构
辽宁师范大学计算机与信息技术学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2011年第1期33-36,41,共5页
-
基金
辽宁省科技计划项目
编号2008216014
+3 种基金
辽宁省教育厅高等学校科研基金资助项目
编号L2010229
大连市优秀青年科技人才基金资助项目
编号2008J23JH026
-
文摘
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间.
-
关键词
数据挖掘
最大频繁项目集
条件频繁模式树
超集检测
-
Keywords
data mining
maximal frequent itemsets
conditional FP-tree
superset checking
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于循环十字链表的频繁模式挖掘算法
被引量:5
- 2
-
-
作者
段仰广
韦玉科
-
机构
广东工业大学计算机学院
-
出处
《计算机技术与发展》
2009年第10期73-76,共4页
-
基金
国家科技支撑计划课题(2006BAI08B01-03)
-
文摘
FP-growth算法是当前挖掘频繁模式的有效算法之一,但FP树的节点占用空间较大,长时间占用内存不释放,挖掘过程中需要产生大量的条件FP树,因而时空效率不理想。提出了一种循环十字链表结构用作存储事务数据库,而不生成FP树,在挖掘频繁项集的过程中,这种链表结构逐步缩小,减少了内存的使用率,通过构建排序的条件频繁模式树挖掘频繁项集。理论分析和实验表明基于这种结构的排序条件频繁模式树挖掘频繁项集具有较好的时空效率。
-
关键词
频繁模式
循环十字链表
排序条件频繁模式树
-
Keywords
frequent pattern
circular orthogonal linked list
sort condition FP-tree
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-