-
题名基于索引数组和复合频繁模式树的频繁闭项集挖掘算法
被引量:1
- 1
-
-
作者
宋威
杨炳儒
徐章艳
张桃红
-
机构
北京科技大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2007年第8期165-167,189,共4页
-
基金
国家科技成果重点推广项目计划(2003EC000001)资助
-
文摘
频繁闭项集惟一确定频繁项集且规模小得多。CROP是一种基于复合频繁模式树的、频繁闭项集高效挖掘算法,但存在着候选结点过多的问题。这些非闭合结点的生成、检查和剪裁带来了大量不必要的操作。提出了一种改进的频繁闭项集挖掘算法CROP_Index。该算法用"索引数组"来组织数据,找到频繁共同出现的项集。基于二进制位图,给出了一个包含索引的计算方法,并利用索引启发信息合并,得到复合型频繁模式树的初始结点;同时给出一些新的性质,使得改进的算法只生成闭合结点,从而节省了大量不必要的操作,缩小了搜索空间。实验结果表明该算法效率较高。
-
关键词
数据挖掘
关联规则
频繁闭项集
索引数组
复合频繁模式树
-
Keywords
Data mining, Association rule, Frequent closed itemset, Index array, Compound frequent itemset tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-