-
题名一种基于大项集重用的序列模式挖掘算法
被引量:10
- 1
-
-
作者
宋世杰
胡华平
周嘉伟
金士尧
-
机构
国防科学技术大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第1期68-74,共7页
-
基金
国家自然科学基金项目(60573136)
国家"八六三"高技术研究发展计划基金项目(2003AA142010)
-
文摘
在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM·该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一大序列项集作为“集成块”,在挖掘k大序列时重用大项集·并以兄弟节点为种子生成候选大序列,利用1st-TID对支持度进行计数·实验表明,对于大规模事务数据库,该算法有效地提高了挖掘效率·
-
关键词
序列模式挖掘
位图表示法
项集扩展
序列扩展
-
Keywords
sequential pattern mining
bitmap representation
itemset-extended
sequence-extended
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名逆向索引FP-tree挖掘频繁项集
- 2
-
-
作者
周涛
-
机构
陕西理工学院
-
出处
《现代电子技术》
2007年第4期143-145,共3页
-
基金
陕西理工学院教改项目资助(YJF0524)
-
文摘
在对逆向FP-tree的研究基础上提出了逆向索引FP-tree挖掘频繁项集的算法。该算法构造了逆向索引FP-tree,通过寻找扩展频繁项集与合并第一棵子树的方法挖掘频繁项集,给出了逆向索引FP-tree的性质和挖掘算法。
-
关键词
数据挖掘
FP—tree
扩展频繁项集
逆向
-
Keywords
data mining
FP - tree
extending frequent itemsets
conversed
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-