期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
Research and Application on Web Information Retrieval Based on Improved FP-Growth Algorithm 被引量:2
1
作者 JIAO Minghai YAN Ping JIANG Huiyan 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1065-1068,共4页
A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each n... A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each node are kept. Route information of different nodes in a same item are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. An example of Web key words retrieval is given to analyze and verify the frequent pattern algorithm in this paper. 展开更多
关键词 data mining CHAINS fp-growth algorithm frequent pattern aggregative information retrieval
下载PDF
A New Algorithm for Mining Frequent Pattern 被引量:2
2
作者 李力 靳蕃 《Journal of Southwest Jiaotong University(English Edition)》 2002年第1期10-20,共11页
Mining frequent pattern in transaction database, time series databases, and many other kinds of databases have been studied popularly in data mining research. Most of the previous studies adopt Apriori like candidat... Mining frequent pattern in transaction database, time series databases, and many other kinds of databases have been studied popularly in data mining research. Most of the previous studies adopt Apriori like candidate set generation and test approach. However, candidate set generation is very costly. Han J. proposed a novel algorithm FP growth that could generate frequent pattern without candidate set. Based on the analysis of the algorithm FP growth, this paper proposes a concept of equivalent FP tree and proposes an improved algorithm, denoted as FP growth * , which is much faster in speed, and easy to realize. FP growth * adopts a modified structure of FP tree and header table, and only generates a header table in each recursive operation and projects the tree to the original FP tree. The two algorithms get the same frequent pattern set in the same transaction database, but the performance study on computer shows that the speed of the improved algorithm, FP growth * , is at least two times as fast as that of FP growth. 展开更多
关键词 data mining algorithm frequent pattern set fp growth
下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
3
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 fp-growth算法 分布式计算 Spark框架
下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
4
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 fp—growth 频繁模式
下载PDF
基于Spark的并行FP-Growth算法优化及实现 被引量:9
5
作者 顾军华 武君艳 +2 位作者 许馨匀 谢志坚 张素琪 《计算机应用》 CSCD 北大核心 2018年第11期3069-3074,共6页
为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然... 为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。 展开更多
关键词 大数据平台 关联规则 频繁项集 频繁模式增长算法 SPARK
下载PDF
一种改进的FP-Growth关联规则挖掘算法 被引量:2
6
作者 尤磊 辛大欣 石云平 《国外电子测量技术》 2007年第5期22-25,共4页
挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的... 挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验结果表明,改进算法能够比较明显地提高挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁项集 fp-growth算法 fp-TREE
下载PDF
基于快速模式增长的FP-growth改进算法 被引量:1
7
作者 党敏侠 孟德鑫 《指挥信息系统与技术》 2012年第4期73-76,共4页
FP-growth算法是当前一种高效的频繁模式挖掘算法,分析了FP-growth算法的性能消耗,引入了条件频度基的数据结构用于存储构建条件FP-tree的所有频度信息,提出了自顶向下与自底向上结合的模式增长方法,该方法避免了原算法在遍历FP-tree时... FP-growth算法是当前一种高效的频繁模式挖掘算法,分析了FP-growth算法的性能消耗,引入了条件频度基的数据结构用于存储构建条件FP-tree的所有频度信息,提出了自顶向下与自底向上结合的模式增长方法,该方法避免了原算法在遍历FP-tree时的性能浪费。试验表明,运用了快速模式增长的改进算法的效率比原算法显著提高。 展开更多
关键词 频繁模式挖掘 fp-growth算法 条件频度基 模式增长
下载PDF
FP-Growth关联规则挖掘的改进算法 被引量:2
8
作者 张星 李蓓 《平顶山工学院学报》 2008年第1期21-24,共4页
文章通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验表明:改进算法能明显地提高挖掘效率。
关键词 关联规则 fp—Growth算法 fp—Tree 数据挖掘
下载PDF
关联规则算法FP-growth的研究与分析 被引量:4
9
作者 侯长满 余彪 《计算机与网络》 2016年第24期58-61,共4页
FP-growth算法是关联规则挖掘中应用最为广泛的挖掘算法,与经典算法Apriori算法最大的区别是不需要挖掘候选集,所以在挖掘效率上有了很大的提升,但是在构建模式树FP-tree时是基于整个事务数据库的,当遇到大型数据库或挖掘约束条件严格时... FP-growth算法是关联规则挖掘中应用最为广泛的挖掘算法,与经典算法Apriori算法最大的区别是不需要挖掘候选集,所以在挖掘效率上有了很大的提升,但是在构建模式树FP-tree时是基于整个事务数据库的,当遇到大型数据库或挖掘约束条件严格时,算法执行过程中占用内存较大,对空间要求较高,且是递归调用,执行效率不高。在对FP-growth算法研究的基础上提出了一种改进算法,该算法改变FP-tree结构,将一棵FP-tree分为多条子树进行频繁模式的挖掘,减少了内存的占用,提高了算法的执行效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法
下载PDF
基于FP-GROWTH算法的关联规则挖掘算法研究 被引量:2
10
作者 陈寅 《无线互联科技》 2017年第19期118-121,124,共5页
互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决... 互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决策支持的新技术。FP-GROWTH算法只进行2次数据库扫描。它不使用侯选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。文章研究FP-GROWTH算法理论的同时实现了一个简单算法演示的系统。系统包括算法的执行,对数据库的修改、查询、删除的操作。最后,对FP-GROWTH算法和Apriori算法进行了比较。 展开更多
关键词 数据挖掘 关联规则 fp-growth算法 候选集 频繁模式树
下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
11
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fp—tree
下载PDF
基于FP_Growth算法的关联规则挖掘研究及应用 被引量:6
12
作者 马瑞敏 吴海霞 《太原师范学院学报(自然科学版)》 2021年第1期19-22,共4页
关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生... 关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生的共同爱好,有助于更好地开展校园文化活动. 展开更多
关键词 关联规则 频繁项集 fp_GROWTH算法 fp-TREE 条件模式基
下载PDF
压缩FP-Tree的改进搜索算法 被引量:8
13
作者 吴倩 罗健旭 《计算机工程与设计》 北大核心 2015年第7期1771-1777,共7页
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁... 为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。 展开更多
关键词 数据挖掘 关联规则 压缩频繁模式树 APRIORI算法 频繁模式增长算法
下载PDF
基于逆向FP-树的频繁模式挖掘算法 被引量:8
14
作者 赵艳铎 宋斌恒 《计算机应用》 CSCD 北大核心 2005年第6期1385-1387,共3页
提出了一种称为逆向FP 合并的算法,该算法逆向构造FP 树并通过在其中寻找频繁扩展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP 增长算法,其中时间效率提高了2倍以上。此外,新算法还具有良好的伸缩性。
关键词 数据挖掘 频繁模式 逆向fp-树 逆向fp-合并算法 频繁扩展项
下载PDF
基于FP-参考树/表的频繁模式挖掘算法 被引量:2
15
作者 石巍 傅彦 《计算机科学》 CSCD 北大核心 2006年第6期206-209,共4页
通分析FP-growth算法中包含的冗余操作,引入数据结构FP参考树/表,改变FP-growth算法中条件模式基的存储和生成方式,提出了新的FPRSG算法,高效地解决了频繁模式挖掘问题。理论分析与实验结果表明,FPRSG算法优于FP-growth算法。
关键词 关联规则 频繁模式 fp参考树/表 fp参考收缩/增长算法 条件模式基
下载PDF
改进的关联规则挖掘算法——MIFP-Apriori算法 被引量:33
16
作者 曾子贤 巩青歌 张俊 《科学技术与工程》 北大核心 2019年第16期216-220,共5页
Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优... Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优化策略提出了一种改进的关联规则挖掘算法——MIFP-Apriori算法。实验表明,该算法能够将扫描数据库次数降低到一次,有效解决产生大量冗余候选集的缺陷,提高算法效率。 展开更多
关键词 数据挖掘 关联规则挖掘 APRIORI算法 频繁模式树(fp-Tree) 改进的频繁模式树 MIfp-Apriori算法
下载PDF
改进加权方法的告警关联分析算法 被引量:1
17
作者 朱圳 张引发 +1 位作者 刘立芳 齐小刚 《吉林大学学报(信息科学版)》 CAS 2023年第1期57-66,共10页
以往告警关联分析算法中将告警重要性视为相同,为区分不同告警的重要性差异,以及告警中包含信息量的差异性,提出一种改进加权方法的告警关联分析算法。首先将告警信息中有关告警重要性的属性量化,并使用极端梯度提升(XGBoost:eXtreme Gr... 以往告警关联分析算法中将告警重要性视为相同,为区分不同告警的重要性差异,以及告警中包含信息量的差异性,提出一种改进加权方法的告警关联分析算法。首先将告警信息中有关告警重要性的属性量化,并使用极端梯度提升(XGBoost:eXtreme Gradient Boosting)集成学习模型训练,得到告警属性的权重值,并对告警数据赋予权重;然后,将网络拓扑数据加入滑动窗口中,改进传统滑动窗口划分事务存在的问题,改进后的滑动窗口划分的事务集更加真实可靠;最终将加权后的告警事务集使用加权FP-Growth(Frequent Pattern Growth)算法挖掘频繁告警和关联规则。通过实验验证了该改进加权方法的告警关联分析算法在挖掘频繁告警、重要关联规则和时间上都有很好的性能。 展开更多
关键词 告警相关性分析 通信网络 XGBoost算法 加权告警分析 fp-growth算法
下载PDF
一种面向高校学生体测数据的模式挖掘方法 被引量:1
18
作者 林志杰 彭珍连 +1 位作者 曹步清 陈铁平 《信息与电脑》 2023年第4期184-189,共6页
目前,每年测试高校大学生的体质健康,会产生大量的数据,为了提高关联规则对体测数据的挖掘效率,提出了一种面向高校学生体质测试数据的模式挖掘方法。利用经典的关联规则挖掘方法如Apriori算法和频繁模式树(Frequent Pattern Tree,FP-Gr... 目前,每年测试高校大学生的体质健康,会产生大量的数据,为了提高关联规则对体测数据的挖掘效率,提出了一种面向高校学生体质测试数据的模式挖掘方法。利用经典的关联规则挖掘方法如Apriori算法和频繁模式树(Frequent Pattern Tree,FP-Growth)算法,对体测数据进行关联规则挖掘。实验结果表明,该模式挖掘的最小数据集能有效提高关联规则算法对体测数据的模式挖掘效率。 展开更多
关键词 模式挖掘 关联规则 APRIORI算法 频繁模式树(fp-growth)算法 学生体质健康测试
下载PDF
基于特征挖掘的电网故障诊断方法 被引量:45
19
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
下载PDF
挖掘数据流中的频繁模式 被引量:25
20
作者 刘学军 徐宏炳 +2 位作者 董逸生 王永利 钱江波 《计算机研究与发展》 EI CSCD 北大核心 2005年第12期2192-2198,共7页
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·... 发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能· 展开更多
关键词 数据流 频繁模式 fp—DS算法 流数据挖掘
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部