期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于FIUT结构增量式频繁项集挖掘 被引量:1
1
作者 寇香霞 任永功 宋奎勇 《计算机应用与软件》 CSCD 北大核心 2012年第7期105-108,共4页
增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频... 增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频繁超度量树叶子结点的支持度确定频繁项集,并与次频繁项集概念相结合进行增量式频繁项集挖掘。实验表明,Pre-FIUT算法能快速扫描和更新数据,合理利用内存,精确获得频繁项集。 展开更多
关键词 FIUT 数据挖掘 频繁项集 次频繁项集 Pre-FIUT算法
下载PDF
基于分区分类法快速更新频繁项集
2
作者 蔡进 薛永生 张东站 《计算机工程与应用》 CSCD 北大核心 2007年第9期170-173,共4页
目前已提出了许多频繁项集更新算法,但是它们往往需要至少扫描一次原数据库,且会丢失一些重要规则。为此,文章提出了一种新的快速更新频繁项集算法CUFIA(Classifying Update Frequent Itemsets Algorithm),该算法通过对新增事务数据分... 目前已提出了许多频繁项集更新算法,但是它们往往需要至少扫描一次原数据库,且会丢失一些重要规则。为此,文章提出了一种新的快速更新频繁项集算法CUFIA(Classifying Update Frequent Itemsets Algorithm),该算法通过对新增事务数据分区后快速逐一扫描,获得频繁项集,并将它们归入3个不同的类别,从而不需要扫描原数据库,便可有效地挖掘出其中的频繁项集,且不丢失重要规则。研究表明,该算法具有很好的可测量性。 展开更多
关键词 关联规则 增量式更新 完全频繁项集 次频繁项集 频繁项集
下载PDF
基于PreHU-tree的高效用项集动态挖掘 被引量:2
3
作者 葛娜 尹四清 《计算机工程与设计》 北大核心 2016年第1期100-106,共7页
针对效用增量挖掘算法在由1-频项生成n-频项时产生大量无用候选频项且不能同时挖掘变化和新增数据集的问题,基于次频繁项的概念,在prelarge-tree结构的基础上每个节点中增加事务加权效用和前缀项集链表,提出一种效用挖掘模式树(PreHU-tr... 针对效用增量挖掘算法在由1-频项生成n-频项时产生大量无用候选频项且不能同时挖掘变化和新增数据集的问题,基于次频繁项的概念,在prelarge-tree结构的基础上每个节点中增加事务加权效用和前缀项集链表,提出一种效用挖掘模式树(PreHU-tree)来挖掘变化事务集的高效用项集。通过搜索PreHU-tree各节点的事务加权效用和前缀项集链表直接确定n-频项,结合前缀项集链表中的项集支持度和项的外部效用挖掘变化式高效用频繁项集。实验结果表明,PreHUtree算法在数据更新后能够快速挖掘出高效用项集,具有良好的可扩展性。 展开更多
关键词 效用挖掘 次频繁项集 动态挖掘 PreHU-tree 频繁项集
下载PDF
基于充分挖掘增量事务的关联规则更新算法 被引量:3
4
作者 蔡进 薛永生 +1 位作者 林丽 张东站 《计算机科学》 CSCD 北大核心 2007年第2期220-222,233,共4页
目前已提出了许多快速的关联规则增量更新挖掘算法,但是它们在处理对新增事务敏感的问题时,往往会丢失一些重要规则。为此,文章提出了一种新的挖掘增量更新后的数据库中频繁项集的算法EUFIA(Entirety Update Frequent Itemsets Algorith... 目前已提出了许多快速的关联规则增量更新挖掘算法,但是它们在处理对新增事务敏感的问题时,往往会丢失一些重要规则。为此,文章提出了一种新的挖掘增量更新后的数据库中频繁项集的算法EUFIA(Entirety Update Frequent Itemsets Algorithm),该算法先对新增事务数据分区,然后快速扫描各分区,能全面有效地挖掘出其中的频繁项集,且不丢失重要规则。同时,最多只扫描1次原数据库也能获得更新后事务数据库的全局频繁项集。研究表明,该算法具有很好的可测量性。 展开更多
关键词 关联规则 增量式更新 频繁项集 次频繁项集 频繁项集
下载PDF
一种改进的增量挖掘算法 被引量:4
5
作者 李春喜 赵雷 《计算机工程》 CAS CSCD 北大核心 2010年第24期42-44,共3页
Pre-FUFP算法基于次频繁项的概念有效处理了频繁模式树的更新,但当有次频繁项变成频繁项时,需要判定原数据库中哪些事务包含该数据项。为此,通过引入次频繁项对应原事务标识符的索引确定需要处理原数据库的事务,减少这一过程所消耗的时... Pre-FUFP算法基于次频繁项的概念有效处理了频繁模式树的更新,但当有次频繁项变成频繁项时,需要判定原数据库中哪些事务包含该数据项。为此,通过引入次频繁项对应原事务标识符的索引确定需要处理原数据库的事务,减少这一过程所消耗的时间,并用基于压缩FP-tree和矩阵技术代替原始FP-growth挖掘出频繁模式。实验证明该算法在时间效率上较Pre-FUFP有大幅度提高。 展开更多
关键词 频繁模式 次频繁项集 增量挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部