期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于HMT和哈希树的Apriori并行算法研究 被引量:3
1
作者 曾志勇 杨辉 余建坤 《计算机工程与设计》 CSCD 北大核心 2012年第1期214-218,共5页
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并... 为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化。实验结果表明,该并行化方案可以很好地提高原算法的效率。 展开更多
关键词 数据挖掘 APRIORI 哈希树 并行 关联规则
下载PDF
基于哈希存储与事务加权的并行Apriori改进算法 被引量:8
2
作者 李洁 朱洪亮 +1 位作者 陈玉玲 辛阳 《计算机工程》 CAS CSCD 北大核心 2020年第11期109-116,共8页
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去... Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统Apriori算法的性能提升越明显,其运行时间与FP-Growth算法相近但避免了FP-Growth算法内存占用过大的问题。 展开更多
关键词 关联规则 频繁项集 哈希存储 事务加权 并行计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部