-
题名最小支持度变化时分布式数据库中频繁项目集更新
- 1
-
-
作者
吉根林
赵斌
-
机构
南京师范大学计算机科学系
苏州大学省计算机信息处理重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2005年第7期1233-1236,共4页
-
基金
国家自然科学基金(79970092)资助
江苏省重点实验室开放基金(KJS03064)资助
-
文摘
讨论分布式数据库系统中最小支持度变化时频繁项目集如何高效更新问题,提出了一种基于最小支持度变化的局部频繁项目集的更新算法ULFS和全局频繁项目集的更新算法UGFS.该算法能够充分利用已挖掘的结果,并且产生较少数量的候选频繁项目集,在求解全局频繁项目集过程中,候选局部频繁项目集支持数的通信量为O(n).将文章提出的算法用Java加以实现,并对算法性能进行了研究.实验结果表明这些算法是可行、有效的,并且具有较快的速度.
-
关键词
频繁项目集
关联规则
频繁项目集更新
分布式数据挖掘
KDD
-
Keywords
frequent itemsets
association rule
frequent itemsets updating
distributed data mining
KDD
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于位存储Tid的CPU并行化Eclat算法
被引量:2
- 2
-
-
作者
孙宗鑫
张桂芸
-
机构
天津师范大学计算机与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第12期79-84,共6页
-
基金
国家自然科学基金面上项目(61572358)
天津市自然科学基金面上项目(16JCYBJC23600)
-
文摘
Eclat算法采用垂直数据表示方式且无需复杂的数据结构,然而在挖掘频繁项目集过程中,交集计数的生成方式造成内存大量消耗和挖掘效率下降。为此,在分析Eclat算法及其现有改进算法基础上,提出一种位存储事务标识(Tid)的CPU并行化Eclat算法。该算法使用二进制位形式存储项目的 Tid,将挖掘频繁项目集的任务分配到CPU各个线程,最大限度地提高CPU的运算性能。实验结果表明,该算法能在降低内存使用的同时,提高频繁项目集的挖掘效率。
-
关键词
频繁项目集挖掘
Eclat算法
位存储
CPU并行化
存储优化
-
Keywords
Frequent Itemset Mining(FIM)
Eclat algorithm
bit storage
CPU parallelization
storage optimization
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-