期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于FP-Growth算法构造批量增量的FP-tree 被引量:3
1
作者 韩天鹏 王峰 王浩 《嘉应学院学报》 2017年第8期21-25,共5页
提出了一种利用FP树表示增量数据库,然后进行增量挖掘的方法,即IA_FP-Growth算法.算法重构和合并两个小的时间上连续的FP树,以获得由FP-Growth算法生成的FP树.与其他从数据库读取事务的顺序增量算法不同,IA_FP-Growth算法使用原FP-tree... 提出了一种利用FP树表示增量数据库,然后进行增量挖掘的方法,即IA_FP-Growth算法.算法重构和合并两个小的时间上连续的FP树,以获得由FP-Growth算法生成的FP树.与其他从数据库读取事务的顺序增量算法不同,IA_FP-Growth算法使用原FP-tree作为预处理数据库来获取项目集,因此其花费较少的时间来构建新的增量FP-tree项目.实验结果表明,随着数据库大小的增加,IA_FP-Growth的运行时间的增加要少得多,而且与其他算法比较也是最少的. 展开更多
关键词 数据挖掘 增量挖掘 频繁模式 FP-tree fp-growth
下载PDF
一种改进的FP-Growth关联规则挖掘算法 被引量:2
2
作者 尤磊 辛大欣 石云平 《国外电子测量技术》 2007年第5期22-25,共4页
挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的... 挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验结果表明,改进算法能够比较明显地提高挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁项集 fp-growth算法 FP-tree
下载PDF
FP-Growth关联规则挖掘的改进算法 被引量:2
3
作者 张星 李蓓 《平顶山工学院学报》 2008年第1期21-24,共4页
文章通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验表明:改进算法能明显地提高挖掘效率。
关键词 关联规则 FP—growth算法 FP—tree 数据挖掘
下载PDF
基于FP-GROWTH算法的关联规则挖掘算法研究 被引量:2
4
作者 陈寅 《无线互联科技》 2017年第19期118-121,124,共5页
互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决... 互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决策支持的新技术。FP-GROWTH算法只进行2次数据库扫描。它不使用侯选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。文章研究FP-GROWTH算法理论的同时实现了一个简单算法演示的系统。系统包括算法的执行,对数据库的修改、查询、删除的操作。最后,对FP-GROWTH算法和Apriori算法进行了比较。 展开更多
关键词 数据挖掘 关联规则 fp-growth算法 候选集 频繁模式树
下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
5
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
下载PDF
压缩FP-Tree的改进搜索算法 被引量:8
6
作者 吴倩 罗健旭 《计算机工程与设计》 北大核心 2015年第7期1771-1777,共7页
为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁... 为克服Apriori算法候选频繁项集的支持数计算效率过低和频繁模式增长算法FP-Growth多次建立条件模式树时内存耗费大的问题,提出基于压缩频繁模式树(CFP-Tree)的改进搜索算法(MCFP-Tree)。利用Apriori算法候选项集生成的思想和压缩频繁模式树紧凑的数据结构,采用自底向上的搜索策略,快速挖掘压缩频繁模式树及其子树,更快得到候选项集的支持数。实验结果表明,该算法可以高效计算出候选频繁项集出现的频次,挖掘效率明显优于Apriori和FPGrowth算法。 展开更多
关键词 数据挖掘 关联规则 压缩频繁模式树 APRIORI算法 频繁模式增长算法
下载PDF
一种面向高校学生体测数据的模式挖掘方法 被引量:1
7
作者 林志杰 彭珍连 +1 位作者 曹步清 陈铁平 《信息与电脑》 2023年第4期184-189,共6页
目前,每年测试高校大学生的体质健康,会产生大量的数据,为了提高关联规则对体测数据的挖掘效率,提出了一种面向高校学生体质测试数据的模式挖掘方法。利用经典的关联规则挖掘方法如Apriori算法和频繁模式树(Frequent Pattern Tree,FP-Gr... 目前,每年测试高校大学生的体质健康,会产生大量的数据,为了提高关联规则对体测数据的挖掘效率,提出了一种面向高校学生体质测试数据的模式挖掘方法。利用经典的关联规则挖掘方法如Apriori算法和频繁模式树(Frequent Pattern Tree,FP-Growth)算法,对体测数据进行关联规则挖掘。实验结果表明,该模式挖掘的最小数据集能有效提高关联规则算法对体测数据的模式挖掘效率。 展开更多
关键词 模式挖掘 关联规则 APRIORI算法 频繁模式树(fp-growth)算法 学生体质健康测试
下载PDF
用垂直数据格式构建FP增长树的算法 被引量:4
8
作者 李洪波 周莉 张吉赞 《计算机工程与应用》 CSCD 北大核心 2009年第8期161-164,共4页
目前FP增长树的建立采用的是事务-项目集数据格式,即水平数据格式,扫描数据库需要2次。采用垂直数据格式,即项目-事务集数据格式,按照最小事务项目表优先的原则投影事务-项目以建立FP增长树,扫描数据库仅需1次。设计了独特的垂直项目头... 目前FP增长树的建立采用的是事务-项目集数据格式,即水平数据格式,扫描数据库需要2次。采用垂直数据格式,即项目-事务集数据格式,按照最小事务项目表优先的原则投影事务-项目以建立FP增长树,扫描数据库仅需1次。设计了独特的垂直项目头表独特的存储结构,便于垂直数据的存储、事务的投影、FP树的建立和垂直数据的增量更新。 展开更多
关键词 水平数据格式 垂直数据格式 最小事务项目表 垂直项目头表 FP增长树
下载PDF
基于频繁模式树的一种关联规则挖掘算法及其在铁路隧道安全管理中的应用 被引量:9
9
作者 徐维祥 苏晓军 《中国安全科学学报》 CAS CSCD 2007年第3期25-32,共8页
关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新... 关联规则的FP-growth算法是数据挖掘中性能较好的一种算法,笔者在分析该算法的基础上进行改造探讨,并提出了一种基于FP-tree的高性能关联规则挖掘算法FP-growthN,该新算法特别适合对那些数据量很大但数据项很稀疏的数据进行挖掘。将新算法用于挖掘铁路隧道各病害的关联中,通过对成都铁路局管辖的2005年的2787条隧道病害数据的343条重点隧道有效病害数据的关联分析,得出了各隧道病害之间隐藏着的关系。新法的提出及其应用结果对铁路部门制定检测标准和防治隧道病害有一定的指导作用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 频繁模式树 频繁模式增长 隧道病害
下载PDF
不产生候选的快速投影频繁模式树挖掘算法 被引量:11
10
作者 何炎祥 向剑文 +1 位作者 朱骁峰 孔维强 《计算机科学》 CSCD 北大核心 2002年第11期71-75,共5页
Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especia... Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently. 展开更多
关键词 事务数据库 快速投影频繁模式树挖掘算法 数据挖掘 频繁项集
下载PDF
基于IS~±树模型的频繁模式挖掘 被引量:3
11
作者 马海兵 张成洪 +1 位作者 张锦 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2005年第4期588-593,共6页
IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一... IS-树是一种新型的全文存储索引模型.提出一种基于扩展I-S树模型的频繁模式挖掘算法.和FPgrowth方法一样,算法直接构造频繁项集,不进行Apriori算法所采用的代价很高的候选集产生与测试操作.然而它比FP-树模型具有更多的优点:只需扫描一遍事务库;挖掘任务只局部关联于一棵根树;动态更新性好,仅做增量变化.实验表明,其具有与FP-growth算法相当甚至更高的效率.更重要的是,IS+树模型同时是一种事务库的良好索引形式,具有高效支持事务查询的能力. 展开更多
关键词 频繁模式 APRIORI算法 FP—growth算法 IS-树 IS^+-树
下载PDF
基于加权频繁模式树的通信网络告警规则挖掘方法 被引量:13
12
作者 罗明 孟传伟 黄海量 《计算机工程》 CAS CSCD 北大核心 2016年第4期190-196,共7页
传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则... 传统通信网络告警处理方法主要由维护专家依据经验判断形成处理规则并固化在网络告警系统中进行实现,然而该人工维护方式难以适应海量数据环境下实时通信告警规则的处理需求。为此,提出一种基于加权频繁模式树(WFP-tree)算法的告警规则自动挖掘方法,将原始告警数据按时间窗口方式进行分段处理,通过BP神经网络、支持向量机、层次分析法生成告警设备的权重信息,并采用WFP-tree算法自动挖掘加权频繁项集。实验结果表明,与传统Apriori和FP-growth算法相比,WFP-tree算法在通信网络告警分析方面具有更好的频繁项压缩效果及更强的重要关联规则发现能力。 展开更多
关键词 通信网络告警 关联规则 权重因子 加权频繁项集 fp-growth算法 加权频繁模式树算法 支持度
下载PDF
更优的快速频繁模式树生成算法 被引量:3
13
作者 喻斌 武友新 《计算机工程与设计》 CSCD 北大核心 2007年第20期4853-4855,共3页
频繁模式增长算法是一种不产生候选频繁项集的关联规则挖掘算法。利用哈希表来存储数据库中事务信息,可以减少对数据库的扫描次数,从而得到一种更优的快速频繁模式树生成算法,即OFP-tree算法。举例说明了该算法的执行过程并对该算法进... 频繁模式增长算法是一种不产生候选频繁项集的关联规则挖掘算法。利用哈希表来存储数据库中事务信息,可以减少对数据库的扫描次数,从而得到一种更优的快速频繁模式树生成算法,即OFP-tree算法。举例说明了该算法的执行过程并对该算法进行了分析和改进,最后阐述了该算法相对于传统频繁模式树生成算法的优越性。 展开更多
关键词 关联规则 关联挖掘 频繁模式增长 频繁模式树 哈希表
下载PDF
数据流上一种单遍扫描频繁模式树结构 被引量:1
14
作者 谭军 卜英勇 陈爱斌 《计算机工程与应用》 CSCD 2013年第2期152-154,共3页
针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——&... 针对频繁模式增长算法无法适应数据流的无限性和流动性的特点,提出一种新颖的FP-tree的变形结构——FPS-tree,只需单遍扫描便能获取当前窗口的全部数据库信息。为了在滑动窗口时有效地删除过期窗格和插入新窗格,提出一个新颖的概念——"尾结点",FPS-tree中每条路径上的窗格信息只保持在尾结点里。实验结果表明FPS-tree的压缩性能要优于其他单遍扫描的前缀树结构。 展开更多
关键词 数据流 频繁模式增长算法 单遍扫描模式树 尾结点
下载PDF
基于FP-树挖掘大数据库的方法及算法PCM 被引量:6
15
作者 郑泉 王建东 《计算机工程与应用》 CSCD 北大核心 2004年第7期182-184,197,共4页
该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构造FP-树并挖掘它,如果子数据库的FP-树不能放进内存,则该方法可递归地用于该子数据库。
关键词 FP-树 FP-增长 频繁模式 频繁项 子数据库
下载PDF
基于MapReduce的频繁项集并行挖掘算法 被引量:8
16
作者 马强 杨金民 《计算机应用与软件》 CSCD 2015年第9期13-16,101,共5页
现有FP-growth频繁集挖掘算法在处理大数据时存在时空效率不高的问题,且内存的使用随着数据的增加已经无法满足把待挖掘数据压缩存储在单个内存中,为此,提出一种基于MapReduce模型的频繁项集并行挖掘算法。该算法采用一种基于key/value... 现有FP-growth频繁集挖掘算法在处理大数据时存在时空效率不高的问题,且内存的使用随着数据的增加已经无法满足把待挖掘数据压缩存储在单个内存中,为此,提出一种基于MapReduce模型的频繁项集并行挖掘算法。该算法采用一种基于key/value键值对直接扫描value寻找条件模式基的方式,同时通过在原有FP-tree树节点中新增一个带频繁项前缀的域空间来构建一颗新的条件模式树NFP-tree,使得对一项频繁项的条件模式基进行一次建树一次遍历就可以得到相应的频繁项集。对所提出的算法在Hadoop平台进行了验证与分析,实验结果表明该算法效率较传统FP-growth算法平均提高16.6%。 展开更多
关键词 频繁项集 FP—growth MAPREDUCE 条件模式基 NFP—tree并行
下载PDF
一种基于字典树的传感器节点关联规则的挖掘算法 被引量:2
17
作者 梅淑英 林亚平 +1 位作者 周四望 许晖 《计算机工程与科学》 CSCD 北大核心 2010年第4期119-121,124,共4页
无线传感器网络中节点密集,分布范围广,长期监测使得信息量巨大,如何从大量的感知数据中提取或"挖掘"有用的知识,就成为无线传感器网络中信息处理的核心问题。本文提出一种新的关联规则挖掘算法PLT-STREAM,用来发现节点之间... 无线传感器网络中节点密集,分布范围广,长期监测使得信息量巨大,如何从大量的感知数据中提取或"挖掘"有用的知识,就成为无线传感器网络中信息处理的核心问题。本文提出一种新的关联规则挖掘算法PLT-STREAM,用来发现节点之间的有用关联,以此消除节点之间信息的冗余。该算法能帮助用户对数据进行有效的融合、分类、查询、分析、理解和决策。实验结果表明,该方法能够有效减少信息处理中通信和计算所消耗的能量,缩短数据查询响应的时间,从而延长整个网络的寿命。 展开更多
关键词 频繁模式 模式增长 字典树 关联规则 传感器节点
下载PDF
动车组故障诊断知识挖掘中改进的并行频繁模式增长算法 被引量:4
18
作者 周斌 徐文胜 《计算机集成制造系统》 EI CSCD 北大核心 2016年第10期2450-2457,共8页
针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据... 针对动车组历史运维数据的知识挖掘问题,从有效利用动车组历史运维数据来指导动车组故障诊断的角度出发,分析了现有并行频繁模式增长算法的实现形式和不足。结合动车组故障诊断的要求,提出利用局部频繁模式树代替全局频繁模式树的数据挖掘算法。该算法在各主要步骤上均实现了并行处理,优化了局部频繁模式树生成规则,对频繁模式的搜索策略进行了改进。改进后的算法大大提高了关联规则挖掘的效率,挖掘结果很好地保留了故障信息与状态信息之间的关联关系,并合理去除了无效规则。通过对该算法的具体分析与实际测试,表明该算法在动车组故障诊断知识获取过程中具有快速、高效、准确的特点。 展开更多
关键词 故障诊断 动车组 关联规则 并行频繁模式增长算法 局部频繁模式树 MAPREDUCE
下载PDF
基于矩阵技术的频繁项目集挖掘算法 被引量:4
19
作者 田王君 蒋军辉 陈士慧 《计算机工程》 CAS CSCD 北大核心 2011年第16期80-81,97,共3页
频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效... 频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效率及空间效率。 展开更多
关键词 频繁模式 fp-growth算法 矩阵技术 数据挖掘 约束子树方法
下载PDF
频繁模式树增长算法在急诊设备压力性损伤评估与管理应对中的价值研究 被引量:4
20
作者 刘红 许艳 +1 位作者 梁妮妮 刘瑞凤 《中国医学装备》 2022年第7期137-141,共5页
目的:基于频繁模式树增长(FP-Growth)算法构建风险评估模型,探讨其在急诊医疗器械相关压力性损伤(MDRPI)评估和管理应对中的应用价值。方法:选取医院接治的489例急诊患者,根据MDRPI评估与管理模式不同将其分为对照组(237例)和观察组(252... 目的:基于频繁模式树增长(FP-Growth)算法构建风险评估模型,探讨其在急诊医疗器械相关压力性损伤(MDRPI)评估和管理应对中的应用价值。方法:选取医院接治的489例急诊患者,根据MDRPI评估与管理模式不同将其分为对照组(237例)和观察组(252例),在患者救治使用的急救设备中对照组采用传统预防模式管理,观察组采用风险评估模式管理,基于FP-Growth算法挖掘临床MDRPI高频诱发因素,从风险评估、设备选用、皮肤监测和健康宣教4个方面进行风险预防和护理管理,对比两组MDRPI发生率、MDRPI临床分期和急诊设备质量的差异性。结果:观察组外伤、心脑血管病、急腹症、妇产、中毒及其他类型急诊患者MDRPI发生率低于对照组,差异有统计学意义(x^(2)=4.200,x^(2)=5.117,x^(2)=6.935,x^(2)=4.636,x^(2)=5.979,x^(2)=5.107;P<0.05);观察组MDRPI患者中1期、2期、3期和4期压力性损伤发生率好于对照组,差异有统计学意义(x^(2)=35.388,x^(2)=4.219,x^(2)=4.450,x^(2)=4.149;P<0.05);观察组相关的急诊科医生、护士和医学工程处工程师及患者对急诊设备临床服务满意度高于对照组,差异有统计学意义(F=7.549,F=24.484,F=8.624,F=6.799;P<0.05)。结论:基于FP-Growth算法的风险评估模型,能够有效检测急诊科MDRPI的高频诱发因素,控制MDRPI发生率和临床分期,提高急诊设备临床服务质量。 展开更多
关键词 急诊设备 压力性损伤 频繁模式树增长(fp-growth)算法 风险评估 医疗器械相关压力性损伤(MDRPI)
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部