期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于PFP-Growth算法的海量频繁项集挖掘
被引量:
2
1
作者
江雨燕
李平
《计算机技术与发展》
2013年第9期63-65,198,共4页
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算...
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。
展开更多
关键词
频繁项集
海量数据
pfp-growth
下载PDF
职称材料
基于Spark的PFP-Growth并行算法优化实现
被引量:
6
2
作者
方向
张功萱
《现代电子技术》
北大核心
2016年第8期9-13,共5页
随着数据量的增大,FP-Growth算法压缩数据思想的优势就体现出来,基于MapReduce框架的PFP-Growth算法实现该算法在Hadoop平台上的并行化,但是MapReduce框架每次对作业进行操作都要将中间结果输出存储到磁盘,影响算法的效率。为了提高关...
随着数据量的增大,FP-Growth算法压缩数据思想的优势就体现出来,基于MapReduce框架的PFP-Growth算法实现该算法在Hadoop平台上的并行化,但是MapReduce框架每次对作业进行操作都要将中间结果输出存储到磁盘,影响算法的效率。为了提高关联挖掘的效率,基于Spark平台,运用均衡分组的思想对该算法进行改进,同时在对具有很长前缀情况进行共享前缀的拆分,通过4个步骤使IPFP-Growth算法在Spark上实现。实验结果表明在Spark平台上优化过后的算法在性能上要优于PFP-Growth算法。
展开更多
关键词
并行化
SPARK
关联挖掘
pfp-growth
下载PDF
职称材料
一种频繁项集并行挖掘算法
被引量:
3
3
作者
李力
翟东海
靳蕃
《铁道学报》
EI
CAS
CSCD
北大核心
2003年第6期71-75,共5页
频繁项集在数据挖掘领域中起着重要作用。本文提出一种基于FP growth 的并行挖掘频繁项集算法PFP growth(ParallelFP growth)。新算法避免了以前基于Apriori的并行算法反复扫描数据库,产生候选集以及处理机间通信量大的缺点。PFP growt...
频繁项集在数据挖掘领域中起着重要作用。本文提出一种基于FP growth 的并行挖掘频繁项集算法PFP growth(ParallelFP growth)。新算法避免了以前基于Apriori的并行算法反复扫描数据库,产生候选集以及处理机间通信量大的缺点。PFP growth算法将挖掘任务均匀地分布在并行处理机上,在挖掘过程中采用一定划分策略以获得处理机间的任务平衡,并采用适当的数据结构减少并行处理机间数据通信量。在国家高性能计算机上的仿真实验证明,本算法是一种有效的并行算法。
展开更多
关键词
并行
数据挖掘
频繁项集
pfp-growth
下载PDF
职称材料
题名
基于PFP-Growth算法的海量频繁项集挖掘
被引量:
2
1
作者
江雨燕
李平
机构
安徽工业大学管理科学与工程学院
出处
《计算机技术与发展》
2013年第9期63-65,198,共4页
基金
安徽高校省级自然科学研究项目(kj2011z039)
安徽工业大学硕士研究生导师创新基金项目(D2011024)
文摘
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。
关键词
频繁项集
海量数据
pfp-growth
Keywords
frequent itcmset
massive data
pfp-growth
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Spark的PFP-Growth并行算法优化实现
被引量:
6
2
作者
方向
张功萱
机构
南京理工大学计算机科学与技术学院
出处
《现代电子技术》
北大核心
2016年第8期9-13,共5页
基金
江苏省973项目(BK2011022)
国家自然科学基金重点项目(612724420)
文摘
随着数据量的增大,FP-Growth算法压缩数据思想的优势就体现出来,基于MapReduce框架的PFP-Growth算法实现该算法在Hadoop平台上的并行化,但是MapReduce框架每次对作业进行操作都要将中间结果输出存储到磁盘,影响算法的效率。为了提高关联挖掘的效率,基于Spark平台,运用均衡分组的思想对该算法进行改进,同时在对具有很长前缀情况进行共享前缀的拆分,通过4个步骤使IPFP-Growth算法在Spark上实现。实验结果表明在Spark平台上优化过后的算法在性能上要优于PFP-Growth算法。
关键词
并行化
SPARK
关联挖掘
pfp-growth
Keywords
parallelization
Spark
association mining
pfp-growth
分类号
TN911-34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
一种频繁项集并行挖掘算法
被引量:
3
3
作者
李力
翟东海
靳蕃
机构
西南交通大学计算机与通信工程学院
出处
《铁道学报》
EI
CAS
CSCD
北大核心
2003年第6期71-75,共5页
文摘
频繁项集在数据挖掘领域中起着重要作用。本文提出一种基于FP growth 的并行挖掘频繁项集算法PFP growth(ParallelFP growth)。新算法避免了以前基于Apriori的并行算法反复扫描数据库,产生候选集以及处理机间通信量大的缺点。PFP growth算法将挖掘任务均匀地分布在并行处理机上,在挖掘过程中采用一定划分策略以获得处理机间的任务平衡,并采用适当的数据结构减少并行处理机间数据通信量。在国家高性能计算机上的仿真实验证明,本算法是一种有效的并行算法。
关键词
并行
数据挖掘
频繁项集
pfp-growth
Keywords
parallel
data mining
frequent Itemset
pfp-growth
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于PFP-Growth算法的海量频繁项集挖掘
江雨燕
李平
《计算机技术与发展》
2013
2
下载PDF
职称材料
2
基于Spark的PFP-Growth并行算法优化实现
方向
张功萱
《现代电子技术》
北大核心
2016
6
下载PDF
职称材料
3
一种频繁项集并行挖掘算法
李力
翟东海
靳蕃
《铁道学报》
EI
CAS
CSCD
北大核心
2003
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部