-
题名一种基于大项集重用的序列模式挖掘算法
被引量:10
- 1
-
-
作者
宋世杰
胡华平
周嘉伟
金士尧
-
机构
国防科学技术大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第1期68-74,共7页
-
基金
国家自然科学基金项目(60573136)
国家"八六三"高技术研究发展计划基金项目(2003AA142010)
-
文摘
在重新定义序列模式的长度、增加了序列模式的挖掘粒度的基础上,提出一种基于大项集重用的序列模式挖掘算法HVSM·该算法采用垂直位图法表示数据库,先横向扩展项集,将挖掘出的所有大项集组成一大序列项集,再纵向扩展序列,将每个一大序列项集作为“集成块”,在挖掘k大序列时重用大项集·并以兄弟节点为种子生成候选大序列,利用1st-TID对支持度进行计数·实验表明,对于大规模事务数据库,该算法有效地提高了挖掘效率·
-
关键词
序列模式挖掘
位图表示法
项集扩展
序列扩展
-
Keywords
sequential pattern mining
bitmap representation
itemset-extended
sequence-extended
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-