-
题名一种挖掘不确定性数据频繁项集的方法
- 1
-
-
作者
郭乙江
钟智
元昌安
罗锦光
-
机构
广西师范学院计算机与信息工程学院
-
出处
《广西师范学院学报(自然科学版)》
2011年第1期100-104,共5页
-
基金
广西自然科学重点基金项目:突发事件跨媒体空间数据智能集成处理及挖掘研究(No.2011GXNSFD018025)
-
文摘
该文探讨挖掘不确定性数据频繁项集,在Carson Kai-Sang Leung等人提出的一种基于树的UFP-growth算法的基础上进行改进,提出新算法——UFP-growthT。实验表明,该算法可以有效地挖掘不确定性数据的频繁项集,且拥有高效性和伸缩性。改进后的算法在一定程度上减小了UFP-tree的大小,加快了挖掘过程。
-
关键词
不确定性数据
U-Apriori
频繁模式
ufp-tree
-
Keywords
uncertain data
U-Apriori
frequent pattern
ufp-tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于单向频繁模式树的频繁项集挖掘算法
被引量:3
- 2
-
-
作者
蒋东洁
李玲娟
-
机构
南京邮电大学计算机学院
-
出处
《计算机技术与发展》
2019年第10期175-180,共6页
-
基金
国家自然科学基金(61302158,61571238)
-
文摘
频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。
-
关键词
数据挖掘
频繁项集
单向频繁模式树
被约束子树
-
Keywords
data mining
frequent itemset
ufp-tree
constrained sub-tree
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-