-
题名高维大数据集中频繁闭合模式的挖掘
- 1
-
-
作者
余光柱
王亮
易先军
邵世煌
-
机构
东华大学信息学院
湖北省荆州市环境管理信息中心
北京大学计算机软件与微电子学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第17期47-49,共3页
-
基金
高等学校博士学科点专项科研基金资助项目(20060255006)
-
文摘
高维大数据集对现有的数据挖掘算法提出了挑战。该文把挖掘任务分解为挖掘频繁长模式与短模式2个子问题,提出一种在高维大数据集中挖掘长项集的算法,即inter-transaction。该算法利用了高维数据中长事务相交迅速变短的特性,通过事务的交集运算直接得到长闭合模式,同时采用新的减枝策略,优化了事务交集运算的方法。实验表明,该方法对高维大数据集非常有效。
-
关键词
高维大数据集
频繁闭合模式
减枝策略
-
Keywords
large high dimensional dataset
frequent closet pattern
pruning strategy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于压缩FP-树的最大频繁项集挖掘算法
被引量:3
- 2
-
-
作者
马达
王佳强
-
机构
吉林大学计算机科学与技术学院
-
出处
《长春理工大学学报(自然科学版)》
2009年第3期457-461,共5页
-
基金
国家自然科学基金重大项目(60496321)
国家自然科学基金(60573073
+2 种基金
60773099)
国家863高技术研究发展计划项目基金(2006AA10Z245
2006AA10A309)
-
文摘
针对基于FP-树挖掘最大频繁项集的算法需要大量的递归调用导致挖掘效率降低的问题,本文提出一种减枝策略并结合FP-树的结构,依据构造Patricia-树的基本原理提出一种PFP-树,将FP-树中满足一定条件的结点进行合并来保存事务数据库,对事务数据库进行进一步压缩以达到降低内存开销和递归调用次数的目的。实验表明,当最小支持度较小时,在执行效率尤其在内存开销方面都有一定的改善。
-
关键词
最大频繁项集
减枝策略
Patricia-树
FP-树
-
Keywords
maximal frequent
itemsets
prune strategy
Patricia-tree
FP-tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-