题名 基于FIUT结构增量式频繁项集挖掘
被引量:1
1
作者
寇香霞
任永功
宋奎勇
机构
辽宁师范大学计算机与信息技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第7期105-108,共4页
基金
教育部留学回国人员科研启动基金项目
辽宁省科技计划项目(2008216014)
+1 种基金
辽宁省教育厅高等学校科研基金项目(L2010229)
大连市优秀青年科技人才基金项目(2008J23JH026)
文摘
增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频繁超度量树叶子结点的支持度确定频繁项集,并与次频繁项集概念相结合进行增量式频繁项集挖掘。实验表明,Pre-FIUT算法能快速扫描和更新数据,合理利用内存,精确获得频繁项集。
关键词
FIUT
数据挖掘
频繁 项集
次频繁项集
Pre-FIUT算法
Keywords
FIUT Data mining Frequent itemset Prelarge item Pre-FIUT algorithm
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于分区分类法快速更新频繁项集
2
作者
蔡进
薛永生
张东站
机构
厦门大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第9期170-173,共4页
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.50474033)
福建省自然科学基金(the Natural Science Foundation of Fujian Province of China under Grant No.A0310008)
福建省高新技术研究开放计划重点项目(No.2003H043)。
文摘
目前已提出了许多频繁项集更新算法,但是它们往往需要至少扫描一次原数据库,且会丢失一些重要规则。为此,文章提出了一种新的快速更新频繁项集算法CUFIA(Classifying Update Frequent Itemsets Algorithm),该算法通过对新增事务数据分区后快速逐一扫描,获得频繁项集,并将它们归入3个不同的类别,从而不需要扫描原数据库,便可有效地挖掘出其中的频繁项集,且不丢失重要规则。研究表明,该算法具有很好的可测量性。
关键词
关联规则
增量式更新
完全频繁 项集
次频繁项集
弱频繁 项集
Keywords
association rules
incremental updating
entirely frequent itemsets
inferior frequent itemsets
weak frequent itemsets
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于PreHU-tree的高效用项集动态挖掘
被引量:2
3
作者
葛娜
尹四清
机构
中北大学计算机与控制工程学院
出处
《计算机工程与设计》
北大核心
2016年第1期100-106,共7页
文摘
针对效用增量挖掘算法在由1-频项生成n-频项时产生大量无用候选频项且不能同时挖掘变化和新增数据集的问题,基于次频繁项的概念,在prelarge-tree结构的基础上每个节点中增加事务加权效用和前缀项集链表,提出一种效用挖掘模式树(PreHU-tree)来挖掘变化事务集的高效用项集。通过搜索PreHU-tree各节点的事务加权效用和前缀项集链表直接确定n-频项,结合前缀项集链表中的项集支持度和项的外部效用挖掘变化式高效用频繁项集。实验结果表明,PreHUtree算法在数据更新后能够快速挖掘出高效用项集,具有良好的可扩展性。
关键词
效用挖掘
次频繁项集
动态挖掘
PreHU-tree
频繁 项集
Keywords
utility mining
pre-large itemsets
dynamic mining
PreHU-tree
frequent itemsets
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于充分挖掘增量事务的关联规则更新算法
被引量:3
4
作者
蔡进
薛永生
林丽
张东站
机构
厦门大学计算机科学系
出处
《计算机科学》
CSCD
北大核心
2007年第2期220-222,233,共4页
基金
国家自然科学基金项目(50474033)
福建省自然科学基金项目(A0310008)
福建省高新技术研究开放计划重点项目(2003H043)
文摘
目前已提出了许多快速的关联规则增量更新挖掘算法,但是它们在处理对新增事务敏感的问题时,往往会丢失一些重要规则。为此,文章提出了一种新的挖掘增量更新后的数据库中频繁项集的算法EUFIA(Entirety Update Frequent Itemsets Algorithm),该算法先对新增事务数据分区,然后快速扫描各分区,能全面有效地挖掘出其中的频繁项集,且不丢失重要规则。同时,最多只扫描1次原数据库也能获得更新后事务数据库的全局频繁项集。研究表明,该算法具有很好的可测量性。
关键词
关联规则
增量式更新
强频繁 项集
次频繁项集
弱频繁 项集
Keywords
Association rules, Incremental updating, Powerful frequent itemsets, Inferior frequent itemsets, Weak frequent itemsets
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 一种改进的增量挖掘算法
被引量:4
5
作者
李春喜
赵雷
机构
苏州大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第24期42-44,共3页
基金
国家自然科学基金资助项目(61073061)
文摘
Pre-FUFP算法基于次频繁项的概念有效处理了频繁模式树的更新,但当有次频繁项变成频繁项时,需要判定原数据库中哪些事务包含该数据项。为此,通过引入次频繁项对应原事务标识符的索引确定需要处理原数据库的事务,减少这一过程所消耗的时间,并用基于压缩FP-tree和矩阵技术代替原始FP-growth挖掘出频繁模式。实验证明该算法在时间效率上较Pre-FUFP有大幅度提高。
关键词
频繁 模式
次频繁项集
增量挖掘
Keywords
frequent pattern
pre-large itemsets
incremental mining
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]