期刊文献+
共找到212篇文章
< 1 2 11 >
每页显示 20 50 100
基于FP-growth的老年行人交通事故损伤致因研究
1
作者 刘永涛 张慧臣 +3 位作者 袁诗泉 高隆鑫 王鹏 赵晨 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第6期176-182,共7页
为研究老年行人交通事故相关因素及其对损伤程度的影响,以中国交通事故深度调查数据库中2013—2023年710起机动车-老年行人事故为分析对象,利用FP-growth算法挖掘出4类影响因素28个类型变量共5594项关联规则。研究结果表明:行人年龄、... 为研究老年行人交通事故相关因素及其对损伤程度的影响,以中国交通事故深度调查数据库中2013—2023年710起机动车-老年行人事故为分析对象,利用FP-growth算法挖掘出4类影响因素28个类型变量共5594项关联规则。研究结果表明:行人年龄、碰撞速度、事故时间段及事故地点是影响老年行人事故死亡率的显著因素。特别是,行人年龄和碰撞速度对死亡率有显著影响,随着碰撞速度的增加,死亡率显著上升;60岁及以上老年行人年龄每增加1岁,其死亡率提升0.037倍。此外,事故发生在夜间、郊区或村庄的死亡率更高。研究结果可为提高老年行人交通安全,制定相关安全措施提供一定参考。 展开更多
关键词 fp-growth算法 逻辑回归模型 老年行人安全 交通事故数据分析
下载PDF
基于改进FP-Growth算法和贝叶斯的营业线施工安全风险分析
2
作者 蔡近近 宋瑞 +2 位作者 何世伟 赵日鑫 姜俊平 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第8期3370-3381,共12页
铁路营业线施工事故致因因素众多且存在关联关系,挖掘事故致因之间的关联关系和因果关系对事故的预防管控具有重要意义。通过文本挖掘对2010—2022年某路局营业线事故调查报告进行处理,提取出51个事故致因因素。基于事故因果连锁理论将... 铁路营业线施工事故致因因素众多且存在关联关系,挖掘事故致因之间的关联关系和因果关系对事故的预防管控具有重要意义。通过文本挖掘对2010—2022年某路局营业线事故调查报告进行处理,提取出51个事故致因因素。基于事故因果连锁理论将致因因素分为人因层、设备层、环境层、管理层4个层级进行分层分析,构建铁路营业线施工事故致因体系。基于压缩算法和差分编码对传统FP-Growth算法进行改进,以此对铁路营业线施工事故致因进行挖掘,找到满足提升度要求的高支持度关联规则和高置信度关联规则,发现关键致因关联和事故致因规律。基于贝叶斯网络理论、致因关联关系和专家经验建立营业线施工安全风险贝叶斯网络,结合复杂网络理论分析网络节点度、聚类系数与节点介数等特征,找到关键致因因素。在此基础上,运用因果推理和故障诊断推理进一步剖析营业线施工过程中的高风险致因,并从“人防、物防、技防”3方面提出预防管控措施。案例结果表明:施工人员操作不当、施工造成接触网故障、施工导致设施设备侵限、施工作业损害电缆设备、施工造成轨道电路故障和施工、检修、清扫设备耽误列车类事故之间的关联关系较为频繁,且为红光带事故的高概率致因,在施工作业过程中应多层次重点预防管控。研究成果为铁路营业线施工安全管理提供一种新的风险分析方法。 展开更多
关键词 铁路营业线施工事故 改进fp-growth算法 关联规则挖掘 贝叶斯网络推理 致因体系
下载PDF
基于FP-Growth算法的直流输电系统阀基电子设备缺陷关联性分析
3
作者 肖耀辉 余俊松 +3 位作者 李为明 薛海平 王永平 戴剑丰 《电子器件》 CAS 2024年第4期1053-1059,共7页
换流阀控制设备作为直流输电系统的核心设备,对其阀基电子设备进行缺陷异常分析是保证直流输电系统稳定可靠运行的基础。提出一种基于FP-Growth算法的直流输电阀基电子设备缺陷关联性分析方法。首先基于阀基电子设备的基本结构与原理,... 换流阀控制设备作为直流输电系统的核心设备,对其阀基电子设备进行缺陷异常分析是保证直流输电系统稳定可靠运行的基础。提出一种基于FP-Growth算法的直流输电阀基电子设备缺陷关联性分析方法。首先基于阀基电子设备的基本结构与原理,采集阀基电子设备缺陷数据;接着对原始数据进行预处理,量化编码后导入FP-Growth算法,通过构建FP-Tree,计算其支持度和置信度,分析阀基电子设备的缺陷特征和影响因素以及各元件之间的关联关系。该方法能高效智能实现对直流输电系统核心设备缺陷的关联分析及故障溯源,为运维人员检修策略的制定提供了理论依据。最后以实际直流输电系统换流阀阀基电子设备缺陷数据仿真算例对所提方法的有效性进行了验证。 展开更多
关键词 直流输电系统 阀基电子设备 fp-growth算法 缺陷关联性分析
下载PDF
基于FP-Growth算法的运毒嫌疑车辆智能推荐研究
4
作者 陈柏翰 罗安飞 《贵州警察学院学报》 2024年第3期84-91,共8页
毒品运输是毒品犯罪的重要环节,虽然毒品运输的手段越来越多样化,但公路运输仍然是主要的运输方式之一,而运毒人员有着各自经典的运毒模式。文中对运毒模式进行特征挖掘,发现存在前后车伴随的规律,根据实际业务中前后车行为以半小时为... 毒品运输是毒品犯罪的重要环节,虽然毒品运输的手段越来越多样化,但公路运输仍然是主要的运输方式之一,而运毒人员有着各自经典的运毒模式。文中对运毒模式进行特征挖掘,发现存在前后车伴随的规律,根据实际业务中前后车行为以半小时为时间间隔导向,建模时选择PostgreSQL数据库。在数据库中建立过往车辆前半小时中间表、后半小时中间表、中间跨度表,运用人工智能数据挖掘技术实现从大量的通行车辆中抽取车辆伴随信息,采用FP-Growth算法挖掘频繁项集,查找高频出现车牌号,通过设定阈值并找到对应的关联规则,经过缉毒民警提供的黑名单进行过滤并排序,最后进行车辆嫌疑度的推荐,为民警拦截嫌疑车辆提供支持,能够在一定程度上提高对嫌疑车辆排查的针对性、准确性和有效性。 展开更多
关键词 毒品运输 运毒模式 特征挖掘 fp-growth算法 关联规则
下载PDF
基于FP-growth算法的高维混合属性数据挖掘方法
5
作者 梁树杰 《计算技术与自动化》 2024年第2期88-92,共5页
常规高维混合属性数据挖掘方法多采用云平台技术,无法完整保留数据的结构相似性,使得数据挖掘效率较低。为此,提出了基于FP-growth算法的高维混合属性数据挖掘方法。为了改善数据质量,根据高维混合属性数据在数据库中的存储结构,采用了... 常规高维混合属性数据挖掘方法多采用云平台技术,无法完整保留数据的结构相似性,使得数据挖掘效率较低。为此,提出了基于FP-growth算法的高维混合属性数据挖掘方法。为了改善数据质量,根据高维混合属性数据在数据库中的存储结构,采用了一种固定算法实现数据去噪,并依据数据类型计算分类型和数值型相似度,结合FP-growth算法对频繁项样本分支进行筛选生成项表头,保证数据结构相似性的完整性,通过搜索项表头输出有效关联规则,实现数据挖掘过程。实验结果表明,所提方法具有较高的挖掘效率。 展开更多
关键词 数据挖掘 fp-growth算法 固定算法 高维混合属性
下载PDF
Research and Application on Web Information Retrieval Based on Improved FP-Growth Algorithm 被引量:2
6
作者 JIAO Minghai YAN Ping JIANG Huiyan 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1065-1068,共4页
A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each n... A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each node are kept. Route information of different nodes in a same item are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. An example of Web key words retrieval is given to analyze and verify the frequent pattern algorithm in this paper. 展开更多
关键词 data mining CHAINS fp-growth algorithm frequent pattern aggregative information retrieval
下载PDF
基于布尔矩阵和MapReduce的FP-Growth算法 被引量:22
7
作者 陈兴蜀 张帅 +1 位作者 童浩 崔晓靖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期135-141,共7页
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次Ma... 关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比. 展开更多
关键词 数据挖掘 关联规则 布尔矩阵 MAPREDUCE fp-growth算法
下载PDF
基于负载均衡和冗余剪枝的并行FP-Growth算法 被引量:8
8
作者 刘祥哲 刘培玉 +2 位作者 任敏 伊静 高钊 《数据采集与处理》 CSCD 北大核心 2016年第1期223-230,共8页
针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值... 针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值,将估计值远大于其他节点的分组进行分割,平均到其他分组中,并且对不同分组中重复的列表元素进行截断,去除冗余数据。实验表明,本文提出的算法能够有效防止并行化的数据倾斜,减少数据冗余,在时间和空间复杂度上要低于以前的并行化FP-Growth算法。 展开更多
关键词 关联规则 MAPREDUCE 冗余剪枝 fp-growth算法
下载PDF
基于FP-growth算法的高校群体性突发事件关联规则分析 被引量:14
9
作者 姬浩 苏兵 吕美 《中国安全科学学报》 CAS CSCD 北大核心 2012年第12期144-151,共8页
为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系... 为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系,实现强关联规则输出。研究结果表明,多数高校群体性突发事件的发生与日期没有必然联系;内部管理因素、内外部突发事件、内部突发事件、政治因素是诱发高校群体性突发事件的主要因素,且外部因素导致的群体性突发事件影响力远远超过内部因素的影响力;当突发事件发生后,应急处置的有效性是决定突发事件影响力的重要因素。 展开更多
关键词 高校安全 群体性突发事件 数据挖掘 fp-growth算法 关联规则
下载PDF
基于Spark框架的FP-Growth大数据频繁项集挖掘算法 被引量:12
10
作者 邵梁 何星舟 尚俊娜 《计算机应用研究》 CSCD 北大核心 2018年第10期2932-2935,共4页
针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集... 针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集;接着,通过扫描垂直数据集来计算项集的支持度,从而识别出非频繁项,并将其从数据集中删除以降低数据尺寸;最后,通过迭代过程来生成频繁k-项集。在标准数据集上的实验结果表明,该算法能够有效挖掘出频繁项集,在执行时间方面具有很大的优越性。 展开更多
关键词 大数据 频繁项集挖掘 Spark框架 fp-growth算法 垂直布局
下载PDF
基于改进FP-Growth算法的CRHX型动车组牵引系统关联失效模型研究 被引量:5
11
作者 王艳辉 王淑君 +1 位作者 李曼 林帅 《铁道学报》 EI CAS CSCD 北大核心 2016年第9期72-80,共9页
基于CRHX型动车组牵引系统运营过程中的故障数据,分析故障数据的特征,研究设备之间的关联失效关系。依托课题组前期对故障信息特征词提取的研究,本文结合故障信息特征词的特点优化经典的关联规则挖掘算法,提出改进的FP-Growth算法,并进... 基于CRHX型动车组牵引系统运营过程中的故障数据,分析故障数据的特征,研究设备之间的关联失效关系。依托课题组前期对故障信息特征词提取的研究,本文结合故障信息特征词的特点优化经典的关联规则挖掘算法,提出改进的FP-Growth算法,并进行算法性能测试,结果表明该算法准确高效;基于改进的FPGrowth算法分析设备的故障信息特征词,挖掘设备关联失效规则,建立设备的关联失效模型。最后,以CRHX型动车组牵引系统为例进行研究,验证了改进FP-Growth算法的有效性和实用性。 展开更多
关键词 故障信息 改进fp-growth算法 关联规则 关联失效模型
下载PDF
基于FP-Growth算法和GRNN的电力知识文本挖掘 被引量:9
12
作者 白勇 张占龙 熊隽迪 《计算机科学》 CSCD 北大核心 2021年第8期86-90,共5页
为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测。首先,对待挖掘的电力文本进行指标提取并编码,生成电力... 为了提高电力知识文本挖掘的性能,采用FP-Growth算法对影响电力需求的强关联因素进行挖掘,运用广义回归神经网络(General Regression Neural Network,GRNN)算法实现电力需求预测。首先,对待挖掘的电力文本进行指标提取并编码,生成电力文本初始FP-Tree;接着采用FP-Growth算法遍历所有FP-Tree,生成频繁集,过滤掉小于最小支持度的项,留下频数较高的频繁项;然后根据更新后的FP-Tree统计关联项,选择与总用电量增长率关联强的变量生成训练样本;最后采用GRNN算法对电力需求文本进行训练,输入电力需求预测样本,设置平滑因子,通过模式层的输出和加权求和来获得电力需求预测结果。实验结果证明,通过合理设置最小支持度和GRNN的平滑因子,能够获得较好的电力文本挖掘性能,与常用挖掘算法相比,所提算法能够获得更高的电力需求预测准确率。 展开更多
关键词 电力文本挖掘 fp-growth算法 广义回归神经网络 平滑因子 频繁集
下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
13
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 fp-growth算法 分布式计算 Spark框架
下载PDF
基于FP-Growth算法的盾构掘进参数与隧道管片渗漏关联性分析 被引量:4
14
作者 吴惠明 杨威 +1 位作者 姜芃 高新闻 《隧道建设》 北大核心 2016年第5期513-517,共5页
为研究隧道管片渗漏与盾构掘进参数之间的关联性,对关联规则中的Apriori算法与FP-Growth算法进行比较,选择FPGrowth算法作为文章研究使用的关联规则算法。选取关键掘进参数并对其数据筛选、划分及编码。采用FP-Growth算法,结合Matlab数... 为研究隧道管片渗漏与盾构掘进参数之间的关联性,对关联规则中的Apriori算法与FP-Growth算法进行比较,选择FPGrowth算法作为文章研究使用的关联规则算法。选取关键掘进参数并对其数据筛选、划分及编码。采用FP-Growth算法,结合Matlab数据分析语言编程,挖掘基于掘进参数频繁项集的管片渗漏关联规则,分析关键掘进参数渗漏原理。依据渗漏频繁项集和渗漏规则,推荐4个关键掘进参数组合的预设范围,并应用在某隧道东线的盾构掘进中。结果表明,关键掘进参数组合优化后的成环管片发生渗漏的概率降低29.36%。 展开更多
关键词 隧道管片 关联规则 fp-growth算法 渗漏水 掘进参数
下载PDF
一种基于FP-growth算法的变电站二次设备缺陷分析方法 被引量:26
15
作者 肖永立 刘松 +1 位作者 见伟 宋亚奇 《电测与仪表》 北大核心 2020年第12期83-90,共8页
为提高监控人员面对设备海量缺陷信息的研判能力,丰富监控人员缺陷处理的技术手段,提出了一种基于FP-growth算法的变电站二次设备缺陷分析方法。利用关联规则挖掘的思想,为智能变电站二次设备建立缺陷模型,并利用FP-growth算法进行了缺... 为提高监控人员面对设备海量缺陷信息的研判能力,丰富监控人员缺陷处理的技术手段,提出了一种基于FP-growth算法的变电站二次设备缺陷分析方法。利用关联规则挖掘的思想,为智能变电站二次设备建立缺陷模型,并利用FP-growth算法进行了缺陷数据的挖掘和分析,挖掘二次设备、缺陷和缺陷原因的关联规则。通过对国家电网公司真实缺陷数据分析,表明所提方法可以有效发现变电站、二次设备、缺陷性质、缺陷原因等因素之间的关联关系,为二次设备高效管控和运维提供有价值信息。 展开更多
关键词 二次设备 缺陷分析 关联规则 fp-growth算法
下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
16
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 fpgrowth 频繁模式
下载PDF
基于Aprior&FP-growth算法的研究 被引量:29
17
作者 晏杰 亓文娟 《计算机系统应用》 2013年第5期122-125,共4页
关联规则挖掘在数据挖掘中占有极其重要的地位,Apriori算法和FP-growth算法是当前关联规则中两大主要频繁项集发现算法.研究了这两种算法的基本思想,指出了算法各自的优缺点并通过具体的实例说明发现频繁项集的方法,最后通过实验对算法... 关联规则挖掘在数据挖掘中占有极其重要的地位,Apriori算法和FP-growth算法是当前关联规则中两大主要频繁项集发现算法.研究了这两种算法的基本思想,指出了算法各自的优缺点并通过具体的实例说明发现频繁项集的方法,最后通过实验对算法进行了性能上的比较. 展开更多
关键词 关联规则 APRIORI算法 fp-growth算法
下载PDF
基于FP-Growth算法的配电网薄弱点分析研究 被引量:7
18
作者 黄悦华 邹子豪 +1 位作者 张赟宁 杨艾竹 《电测与仪表》 北大核心 2020年第17期79-84,135,共7页
随着配电网快速发展,对配电网运行稳定性的要求也愈来愈高。但由于设备复杂度高、外界因素影响较多,造成配电网故障时有发生。针对配电网设备通常于薄弱点处发生故障的问题,文中提出薄弱度的概念来量化分析薄弱点。同时,为判断薄弱点的... 随着配电网快速发展,对配电网运行稳定性的要求也愈来愈高。但由于设备复杂度高、外界因素影响较多,造成配电网故障时有发生。针对配电网设备通常于薄弱点处发生故障的问题,文中提出薄弱度的概念来量化分析薄弱点。同时,为判断薄弱点的薄弱程度,将配电网薄弱度设置为等于FP-Growth算法中支持度的数值。随后将库尔钦斯基(Kulczynski)度量与不平衡比配合使用,验证关联规则的强关联性及是否有意义。通过算例及实际运行情况验证了该方法的有效性,为配电网运行薄弱点的分析检测提供支持。 展开更多
关键词 薄弱点分析 数据挖掘 fp-growth算法 故障诱因 薄弱度
下载PDF
基于FP-Growth算法的民航鸟击事件关联性分析 被引量:5
19
作者 贾萌 邵荃 张金石 《安全与环境学报》 CAS CSCD 北大核心 2016年第1期110-114,共5页
鸟击问题严重威胁航空器运行安全,给航空业造成了巨大的经济损失,为了有效预防民航鸟击事件的发生,根据数据挖掘理论,在分析民航鸟击事件关键诱发属性基础上,提出了一种基于FPGrowth算法的民航鸟击事件关联性分析方法。根据中国民航鸟... 鸟击问题严重威胁航空器运行安全,给航空业造成了巨大的经济损失,为了有效预防民航鸟击事件的发生,根据数据挖掘理论,在分析民航鸟击事件关键诱发属性基础上,提出了一种基于FPGrowth算法的民航鸟击事件关联性分析方法。根据中国民航鸟击事件统计数据,挖掘出鸟击事件各属性间潜在的、有价值的关联,通过设置最小支持度和最小置信度,得出重要的关联性规则。结果表明,该方法根据历史数据可推测出导致鸟击事件发生的相关因素,改善了以往凭借专家经验的片面性、模糊性和不确定性。通过飞机发动机设计、颜色涂装等措施切断导致鸟击事件发生的相关因素,达到有效预防鸟击事件的效果,完善防治措施,最大限度地避免鸟类撞击航空器,保障民航运输安全。 展开更多
关键词 安全工程 鸟击 数据挖掘 fp-growth算法 关联性 防治措施
下载PDF
基于Hadoop的FP-Growth关联规则并行改进算法 被引量:15
20
作者 厍向阳 张玲 《计算机应用研究》 CSCD 北大核心 2018年第1期109-112,共4页
大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。... 大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。在Hadoop平台下,使用负载均衡和数据分割相结合的方式对原始事务数据集分片实现并行化。实验证明,基于Hadoop的负载均衡数据分割FP-Growth并行算法在处理数据量和效率上有所提高。 展开更多
关键词 fp-growth算法 HADOOP 数据分割 负载均衡
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部