期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Spark的FP_Growth算法的并行与优化
被引量:
4
1
作者
石陆魁
张欣
师胜利
《计算机工程与应用》
CSCD
北大核心
2018年第13期52-58,110,共8页
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算法的执行效率。为了提高算法的执行效率,提出了一种基于Spark...
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算法的执行效率。为了提高算法的执行效率,提出了一种基于Spark的RPFP算法,该算法对PFP_Growth算法在均衡分组和降低时间复杂度两方面进行优化,通过把负载大的项放在负载总和最小的组里面实现均衡分组,通过在链头表结构中加入一张哈希表达到快速访问元素地址的目的,从而降低时间复杂度。实验结果表明,RPFP通过优化PFP算法,有效提高了频繁项集的挖掘效率。
展开更多
关键词
FP_GROWTH算法
频繁项集挖掘
负载均衡
链头表
结构
SPARK
下载PDF
职称材料
基于负载均衡的并行FP-Growth算法
被引量:
7
2
作者
高权
万晓冬
《计算机工程》
CAS
CSCD
北大核心
2019年第3期32-35,40,共5页
针对FP-Growth算法查找操作时间复杂度较高的问题,提出一种新的算法LBPFP。在PFP算法基础上,将哈希表加入链头表以实现项地址的快速访问,并设计基于前缀长度的计算量模型,优化并行流程,提升算法的执行效率。在webdocs.dat数据库上进行...
针对FP-Growth算法查找操作时间复杂度较高的问题,提出一种新的算法LBPFP。在PFP算法基础上,将哈希表加入链头表以实现项地址的快速访问,并设计基于前缀长度的计算量模型,优化并行流程,提升算法的执行效率。在webdocs.dat数据库上进行对比实验,结果表明,LBPFP算法比PFP、HPFP、DPFP算法具有更高的频繁项集挖掘效率。
展开更多
关键词
Spark平台
频繁模式增长
并行
负载均衡
链头表
计算量模型
下载PDF
职称材料
题名
基于Spark的FP_Growth算法的并行与优化
被引量:
4
1
作者
石陆魁
张欣
师胜利
机构
河北工业大学计算机科学与软件学院
河北师范大学信息技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2018年第13期52-58,110,共8页
基金
河北省自然科学基金(No.F2016202144
No.F2017202145)
文摘
PFP_Growth算法是FP_Growth算法在Hadoop平台上基于MapReduce的并行化,该算法在分组过程中没有考虑负载均衡问题,导致各个节点完成任务时间不一致,甚至相差很大,从而降低了算法的执行效率。为了提高算法的执行效率,提出了一种基于Spark的RPFP算法,该算法对PFP_Growth算法在均衡分组和降低时间复杂度两方面进行优化,通过把负载大的项放在负载总和最小的组里面实现均衡分组,通过在链头表结构中加入一张哈希表达到快速访问元素地址的目的,从而降低时间复杂度。实验结果表明,RPFP通过优化PFP算法,有效提高了频繁项集的挖掘效率。
关键词
FP_GROWTH算法
频繁项集挖掘
负载均衡
链头表
结构
SPARK
Keywords
FP_Growth algorithm
frequent itemset mining
load balance
head table
Spark
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于负载均衡的并行FP-Growth算法
被引量:
7
2
作者
高权
万晓冬
机构
南京航空航天大学自动化学院
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期32-35,40,共5页
基金
国家部委基金
文摘
针对FP-Growth算法查找操作时间复杂度较高的问题,提出一种新的算法LBPFP。在PFP算法基础上,将哈希表加入链头表以实现项地址的快速访问,并设计基于前缀长度的计算量模型,优化并行流程,提升算法的执行效率。在webdocs.dat数据库上进行对比实验,结果表明,LBPFP算法比PFP、HPFP、DPFP算法具有更高的频繁项集挖掘效率。
关键词
Spark平台
频繁模式增长
并行
负载均衡
链头表
计算量模型
Keywords
Spark platform
FP-Growth
parallel
load balance
head table
workload model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Spark的FP_Growth算法的并行与优化
石陆魁
张欣
师胜利
《计算机工程与应用》
CSCD
北大核心
2018
4
下载PDF
职称材料
2
基于负载均衡的并行FP-Growth算法
高权
万晓冬
《计算机工程》
CAS
CSCD
北大核心
2019
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部