期刊文献+

二进制的top-k闭合频繁模式挖掘

下载PDF
导出
摘要 自从引入频繁模式的概念以来,闭合频繁模式挖掘和增量频繁模式挖掘就成为很多人研究的课题。目前增量模式挖掘有两大类,一类是基于先验算法Apriori,另一类是基于频繁模式树算法FP-tree,前者挖掘时间太长,后者维护FP-tree的开销太大。为了降低数据维护和数据挖掘的时间成本,本文提出了一种基于链表的比特流结构,称为Bitlink。Bitlink算法首先选择大于或等于指定阈值的k+Δ个项,合并计数和比特流都相同的项,从合并项中选择k个作为候选项并按降序排序,根据这k个候选进行迭代,最终生成top-k个闭合频繁模式。实验使用OnlineRetail和BMSWebView两个数据集进行模拟,对比实验为closed frequent patterns by considering anti-monotonic constraint算法(CFPA),实验结果表明Bitlink比CFPA快四分之一。
作者 方仕健
机构地区 广东理工学院
出处 《电脑迷》 2023年第15期10-12,共3页
基金 广东理工学院“质量工程”项目——高等教育教学改革(项目编号:JXGG202117)。
  • 相关文献

参考文献4

二级参考文献40

共引文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部