摘要
频繁项集挖掘是数据挖掘中的一个重要研究课题。在分析Apriori算法与FP-growth算法特点的基础上,提出了一种改进的频繁项集挖掘算法,即索引生成频繁项集算法IGFA。IGFA算法基于Apriori算法并通过"索引二元组"生成候选集,减免了候选集的大量冗余,实验及结果分析表明该算法有效提高了频繁项集的挖掘效率。
Mining frequent itemsets is an important research topic in Data Mining.This paper discussed the characteristics of Apriori algorithm and FP-growth algorithm and proposed an improved algorithm IGFA(Index-binary array Generate Frequent itemsets Algorithm) based on Apriori algorithm.The number of candidates can be reduced greatly by using an index array which based on the binary group.Analysis and experiments show that mining frequent itemsets by IGFA have been proved efficiently.
出处
《计算机工程与应用》
CSCD
北大核心
2009年第4期143-145,共3页
Computer Engineering and Applications
基金
国家自然科学基金No.40471115
河南省高校科技创新人才支持计划No.2008HASTIT012
河南省自然科学基金No.0511011000
河南省科技攻关项目No.0624220081
郑州市科技攻关项目No.064SGDG25127-9
河南工业大学博士基金研究项目No.2008003
空间数据挖掘与信息共享教育部重点实验室开放基金No.200807~~
关键词
数据挖掘
关联规则
频繁项集
索引二元数组
data mining
association rule
frequent itemsets
indexed binary array