题名 基于分区分类法快速更新频繁项集
1
作者
蔡进
薛永生
张东站
机构
厦门大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2007年第9期170-173,共4页
基金
国家自然科学基金(the National Natural Science Foundation of China under Grant No.50474033)
福建省自然科学基金(the Natural Science Foundation of Fujian Province of China under Grant No.A0310008)
福建省高新技术研究开放计划重点项目(No.2003H043)。
文摘
目前已提出了许多频繁项集更新算法,但是它们往往需要至少扫描一次原数据库,且会丢失一些重要规则。为此,文章提出了一种新的快速更新频繁项集算法CUFIA(Classifying Update Frequent Itemsets Algorithm),该算法通过对新增事务数据分区后快速逐一扫描,获得频繁项集,并将它们归入3个不同的类别,从而不需要扫描原数据库,便可有效地挖掘出其中的频繁项集,且不丢失重要规则。研究表明,该算法具有很好的可测量性。
关键词
关联规则
增量式更新
完全频繁 项集
次频繁 项集
弱频繁项集
Keywords
association rules
incremental updating
entirely frequent itemsets
inferior frequent itemsets
weak frequent itemsets
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于充分挖掘增量事务的关联规则更新算法
被引量:3
2
作者
蔡进
薛永生
林丽
张东站
机构
厦门大学计算机科学系
出处
《计算机科学》
CSCD
北大核心
2007年第2期220-222,233,共4页
基金
国家自然科学基金项目(50474033)
福建省自然科学基金项目(A0310008)
福建省高新技术研究开放计划重点项目(2003H043)
文摘
目前已提出了许多快速的关联规则增量更新挖掘算法,但是它们在处理对新增事务敏感的问题时,往往会丢失一些重要规则。为此,文章提出了一种新的挖掘增量更新后的数据库中频繁项集的算法EUFIA(Entirety Update Frequent Itemsets Algorithm),该算法先对新增事务数据分区,然后快速扫描各分区,能全面有效地挖掘出其中的频繁项集,且不丢失重要规则。同时,最多只扫描1次原数据库也能获得更新后事务数据库的全局频繁项集。研究表明,该算法具有很好的可测量性。
关键词
关联规则
增量式更新
强频繁 项集
次频繁 项集
弱频繁项集
Keywords
Association rules, Incremental updating, Powerful frequent itemsets, Inferior frequent itemsets, Weak frequent itemsets
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]