摘要
自从引入频繁模式的概念以来,闭合频繁模式挖掘和增量频繁模式挖掘就成为很多人研究的课题。目前增量模式挖掘有两大类,一类是基于先验算法Apriori,另一类是基于频繁模式树算法FP-tree,前者挖掘时间太长,后者维护FP-tree的开销太大。为了降低数据维护和数据挖掘的时间成本,本文提出了一种基于链表的比特流结构,称为Bitlink。Bitlink算法首先选择大于或等于指定阈值的k+Δ个项,合并计数和比特流都相同的项,从合并项中选择k个作为候选项并按降序排序,根据这k个候选进行迭代,最终生成top-k个闭合频繁模式。实验使用OnlineRetail和BMSWebView两个数据集进行模拟,对比实验为closed frequent patterns by considering anti-monotonic constraint算法(CFPA),实验结果表明Bitlink比CFPA快四分之一。
出处
《电脑迷》
2023年第15期10-12,共3页
基金
广东理工学院“质量工程”项目——高等教育教学改革(项目编号:JXGG202117)。