期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于HMT和哈希树的Apriori并行算法研究
被引量:
3
1
作者
曾志勇
杨辉
余建坤
《计算机工程与设计》
CSCD
北大核心
2012年第1期214-218,共5页
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并...
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化。实验结果表明,该并行化方案可以很好地提高原算法的效率。
展开更多
关键词
数据挖掘
APRIORI
哈希树
并行
关联规则
下载PDF
职称材料
基于哈希存储与事务加权的并行Apriori改进算法
被引量:
8
2
作者
李洁
朱洪亮
+1 位作者
陈玉玲
辛阳
《计算机工程》
CAS
CSCD
北大核心
2020年第11期109-116,共8页
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去...
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统Apriori算法的性能提升越明显,其运行时间与FP-Growth算法相近但避免了FP-Growth算法内存占用过大的问题。
展开更多
关键词
关联规则
频繁项集
哈希存储
事务加权
并行计算
下载PDF
职称材料
题名
基于HMT和哈希树的Apriori并行算法研究
被引量:
3
1
作者
曾志勇
杨辉
余建坤
机构
云南财经大学信息学院
出处
《计算机工程与设计》
CSCD
北大核心
2012年第1期214-218,共5页
基金
云南省自然科学基金项目(2007G079M)
云南财经大学校科研重点基金项目(YC10A003)
文摘
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化。实验结果表明,该并行化方案可以很好地提高原算法的效率。
关键词
数据挖掘
APRIORI
哈希树
并行
关联规则
Keywords
data mining
aprioril hash treesi parallel; association rule
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于哈希存储与事务加权的并行Apriori改进算法
被引量:
8
2
作者
李洁
朱洪亮
陈玉玲
辛阳
机构
北京邮电大学网络空间安全学院
贵州大学贵州省公共大数据重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第11期109-116,共8页
基金
国家重点研发计划(2017YFB0802300)
贵州省科技重大专项(20183001)
贵州省公共大数据重点实验室开放课题(2018BDKFJJ008,2018BDKFJJ020)。
文摘
Apriori算法能够挖掘事物之间的关联关系,但传统Apriori算法每计算一次候选集的支持度,都需要遍历原始事务数据库,多次扫描数据库导致其效率较低。为此,提出一种基于哈希存储与事务加权的改进算法。通过哈希存储的去重特性对事务进行去重,以减少冗余计算。将项目与项集的映射存储到哈希结构中,避免计算候选集的支持度时多次扫描事务数据库。同时开启多个线程,并行计算候选集的支持度,从而提高Apriori算法的运行效率。在开源数据集上的实验结果表明,当数据集中事务条数以及重复事务数越多时,该算法相较于传统Apriori算法的性能提升越明显,其运行时间与FP-Growth算法相近但避免了FP-Growth算法内存占用过大的问题。
关键词
关联规则
频繁项集
哈希存储
事务加权
并行计算
Keywords
association
rule
frequent itemset
hash
storage
transaction weighting
parallel
computing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于HMT和哈希树的Apriori并行算法研究
曾志勇
杨辉
余建坤
《计算机工程与设计》
CSCD
北大核心
2012
3
下载PDF
职称材料
2
基于哈希存储与事务加权的并行Apriori改进算法
李洁
朱洪亮
陈玉玲
辛阳
《计算机工程》
CAS
CSCD
北大核心
2020
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部