期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法 被引量:21
1
作者 宋余庆 朱玉全 +1 位作者 孙志挥 杨鹤标 《计算机研究与发展》 EI CSCD 北大核心 2005年第5期777-783,共7页
目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些... 目前已提出了许多快速的关联规则挖掘算法,实际上用户只关心部分关联规则,如他们仅想知道包含指定项目的规则.当这些约束被用于数据预处理或将它结合到数据挖掘算法中去时,可以显著减少算法的执行时间.为此,考虑了一类包含或不包含某些项目的布尔表达式约束条件,提出了一种快速的基于FPtree的约束最大频繁项目集挖掘算法CMFIMA,并对其更新问题进行了研究,提出了一种增量式更新约束最大频繁项目集挖掘算法CMFIUA. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式 增量式更新
下载PDF
基于频繁模式树的关联规则增量式更新算法 被引量:80
2
作者 朱玉全 孙志挥 季小俊 《计算机学报》 EI CSCD 北大核心 2003年第1期91-96,共6页
研究了大型事务数据库中关联规则的增量式更新问题 ,提出了一种基于频繁模式树的关联规则增量式更新算法 ,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题 。
关键词 频繁模式 关联规则 增量式更新算法 数据挖掘 数据库
下载PDF
不产生候选的快速投影频繁模式树挖掘算法 被引量:11
3
作者 何炎祥 向剑文 +1 位作者 朱骁峰 孔维强 《计算机科学》 CSCD 北大核心 2002年第11期71-75,共5页
Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especia... Frequent Pattern mining plays an essential role in data mining. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns.In this study, we introduce a novel frequent pattern growth (FP-growth)method, which is efficient and scalable for mining both long and short frequent patterns without candidate generation. And build a new project frequent pattern growth (PFP-tree)algorithm on this study, which not only heirs all the advantages in the FP-growth method, but also avoids it's bottleneck in database size dependence. So increase algorithm's scalability efficiently. 展开更多
关键词 事务数据库 快速投影频繁模式挖掘算法 数据挖掘 频繁项集
下载PDF
最大频繁项目集的快速更新 被引量:47
4
作者 吉根林 杨明 +1 位作者 宋余庆 孙志挥 《计算机学报》 EI CSCD 北大核心 2005年第1期128-135,共8页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题 .为克服基于Apriori的最大频繁项目集挖掘算法存在的不足 ,DMFIA采用FP tree存储结构及自顶向下的搜索策略 ,有效地提高了最大频繁项目集的挖掘效率 .但对于频繁项目多而最大频繁项目集维数相对较小的情况 ,DMFIA要经过多层搜索且在每一层产生大量的候选项目集 ,因而影响算法的执行效率 .为此 ,该文提出了DMFIA的改进算法IDMFIA(theImprovedalgorithmofDMFIA) .IDMFI A采用自顶向下和自底向上双向搜索策略 ,可尽早修剪掉较短最大频繁项目集的超集和较长最大频繁项目集的子集 .另外 ,该文还提出最大频繁项目集更新算法FUMFIA(FastUpdatingMaximumFrequentItemsetsAlgorithm) ,该算法充分利用已建立的FP tree和已挖掘的最大频繁项目集 ,可对已挖掘的最大频繁项目集进行高效维护 .实验结果表明 ,IDMFIA和FUMFIA可有效提高最大频繁项目集的挖掘和更新效率 . 展开更多
关键词 数据挖掘 频繁模式 最大频繁项目集 更新
下载PDF
频繁项目集的快速增量式更新算法 被引量:6
5
作者 杨明 孙志挥 +1 位作者 宋余庆 陈耿 《应用科学学报》 CAS CSCD 2003年第4期367-372,共6页
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
关键词 频繁项目集 快速增量式更新算法 频繁模式 数据挖掘 数据库
下载PDF
快速更新全局频繁项目集 被引量:18
6
作者 杨明 孙志挥 宋余庆 《软件学报》 EI CSCD 北大核心 2004年第8期1189-1197,共9页
数据挖掘中的频繁项目集更新算法研究是重要的研究课题之一.目前已有的频繁项目集更新算法主要针对单机环境,有关分布式环境下的全局频繁项目集的更新算法的研究尚不多见.为此,提出了快速更新全局频繁项目集算法(fast updating algorith... 数据挖掘中的频繁项目集更新算法研究是重要的研究课题之一.目前已有的频繁项目集更新算法主要针对单机环境,有关分布式环境下的全局频繁项目集的更新算法的研究尚不多见.为此,提出了快速更新全局频繁项目集算法(fast updating algorithm for globally frequent itemsets,简称FUAGFI).该算法主要考虑数据库记录增加时全局频繁项目集的更新情况.FUAGFI利用已建立的各局部频繁模式树(frequent pattern tree,简称FP-tree)及已挖掘的全局频繁项目集,可有效地降低网络通信量,提高全局频繁项目集的更新效率.实验结果表明,所提出的更新算法是行之有效的. 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 频繁模式(FP—tree) 更新
下载PDF
基于频繁模式树的约束最大频繁项目集挖掘算法研究 被引量:4
7
作者 陈耿 朱玉全 +2 位作者 宋余庆 陆介平 孙志挥 《应用科学学报》 CAS CSCD 北大核心 2006年第1期64-69,共6页
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快... 目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式 增量式更新
下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
8
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式 增量式更新
下载PDF
快速挖掘全局频繁项目集 被引量:35
9
作者 杨明 孙志挥 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2003年第4期620-626,共7页
分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为... 分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率 展开更多
关键词 数据挖掘 全局频繁项目集 频繁模式 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
下载PDF
一种基于分布式数据库的全局频繁项目集更新算法 被引量:4
10
作者 杨明 孙志挥 吉根林 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第6期879-883,共5页
在算法FMAGF的基础上 ,提出了一种基于分布式数据库的全局频繁项目集更新算法———UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况 .UAGFI在最坏的情况下仅须扫描各局部数据库一遍 ,并利用已挖掘的结果 ,可避免传... 在算法FMAGF的基础上 ,提出了一种基于分布式数据库的全局频繁项目集更新算法———UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况 .UAGFI在最坏的情况下仅须扫描各局部数据库一遍 ,并利用已挖掘的结果 ,可避免传送某些原全局频繁项目对应的条件频繁模式树 ,从而降低网络通讯代价 .实验结果表明 。 展开更多
关键词 算法 数据挖掘 分布式数据库 全局频繁项目集 频繁模式 更新 UAGFI
下载PDF
基于FP_tree的频繁项目集增量式更新算法 被引量:5
11
作者 赵岩 姚勇 刘志镜 《计算机工程》 CAS CSCD 北大核心 2008年第11期63-65,共3页
对频繁项目集的更新问题进行研究,提出一种基于频繁模式树的频繁项目集增量式更新算法。充分利用已有挖掘结果,有效解决最小支持度和事务数据库同时发生变化时相应频繁项目集的更新问题。在事务数据库变化同时包括增加和减少的情况下,... 对频繁项目集的更新问题进行研究,提出一种基于频繁模式树的频繁项目集增量式更新算法。充分利用已有挖掘结果,有效解决最小支持度和事务数据库同时发生变化时相应频繁项目集的更新问题。在事务数据库变化同时包括增加和减少的情况下,对算法性能进行分析与测试,结果证明该算法高效可行。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 增量式更新 频繁模式
下载PDF
高效的关联规则快速更新算法 被引量:3
12
作者 谭军 卜英勇 杨勃 《计算机工程与应用》 CSCD 北大核心 2009年第4期146-148,共3页
挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树... 挖掘关联规则的两大经典算法Apriori和FP-tree算法都是以批处理方式处理所有事务。但在实际应用中,新事务频繁地出现,这就需要不断更新关联规则。为了提高更新效率,有效减少扫描原数据库的次数,基于次频繁项的概念,在快速更新频繁模式树(FUFP-tree)算法的基础上,提出了一种改进的算法。实验结果表明新算法具有良好的性能。 展开更多
关键词 关联规则 APRIORI算法 FP-TREE算法 快速更新频繁模式 频繁
下载PDF
分布式数据库全局最大频繁项集增量更新算法 被引量:3
13
作者 何波 闫河 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2012年第3期112-117,共6页
随着分布式数据库记录的不断增加,需要对已挖掘出的全局最大频繁项集进行增量更新。在已经提出的快速挖掘全局最大频繁项集算法(FMMFI)的基础上,提出了分布式数据库全局最大频繁项集增量更新算法(IUGMFI)。IUGMFI算法利用了FMMFI算法已... 随着分布式数据库记录的不断增加,需要对已挖掘出的全局最大频繁项集进行增量更新。在已经提出的快速挖掘全局最大频繁项集算法(FMMFI)的基础上,提出了分布式数据库全局最大频繁项集增量更新算法(IUGMFI)。IUGMFI算法利用了FMMFI算法已经挖掘出的分布式数据库全局频繁项目和全局最大频繁项集。挖掘增量数据库的全局频繁项目,构建增量数据库的FP-tree,挖掘出增量数据库的全局最大频繁项集,采用自上而下的剪枝策略更新全局最大频繁项集。理论分析和实验结果表明,IUGMFI算法是快速而有效的。 展开更多
关键词 数据挖掘 频繁模式 全局最大频繁项集 增量更新算法
下载PDF
基于FP_tree的最大频繁项目集增量式更新算法 被引量:2
14
作者 庹文利 姚勇 《计算机工程与应用》 CSCD 北大核心 2009年第19期117-119,共3页
关联规则的更新是数据挖掘研究的一个重要内容,能否有效地挖掘出动态事务数据库中的最大频繁项目集是衡量一个关联规则更新算法好坏的关键因素。提出基于FP_tree的最大频繁项目集增量式更新(MFIUP)算法,以处理最小支持度和事务数据库同... 关联规则的更新是数据挖掘研究的一个重要内容,能否有效地挖掘出动态事务数据库中的最大频繁项目集是衡量一个关联规则更新算法好坏的关键因素。提出基于FP_tree的最大频繁项目集增量式更新(MFIUP)算法,以处理最小支持度和事务数据库同时发生变化之后相应频繁项目集的更新问题,其中事务数据库的变化同时包括增加和减少两种情况,并对其优越性进行了分析和测试。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 增量式更新 频繁模式
下载PDF
基于FP树的挖掘关联规则的增量式更新的研究
15
作者 陈文 张思松 《铜陵学院学报》 2005年第3期55-56,65,共3页
关联规则的高效维护算法研究是当前数据库研究的热点之一。本文研究了事务数据库中关联规则的增量式更新问题,提出了基于频繁模式树的关联规则增量式更新算法的设计思路,以处理最小支持度或事务数据库发生变化后关联规则的更新问题。
关键词 数据挖掘 关联规则 增量式更新 FP 增量式更新算法 挖掘关联规则 事务数据库 频繁模式 最小支持度 算法研究
下载PDF
关联规则的快速更新算法 被引量:1
16
作者 邵勇 陈波 +1 位作者 史宝东 刘长征 《计算机工程》 CAS CSCD 北大核心 2009年第19期62-64,68,共4页
针对基于支持度变化的最大频繁项集维护问题、频繁项集与最大频繁项集互转换时的维护问题,提出3种相应算法。在挖掘最大频繁项集的过程中不断调节支持度大小,以实现其快速更新。基于最大频繁项集子集的支持计数,将现有最大频繁项集转换... 针对基于支持度变化的最大频繁项集维护问题、频繁项集与最大频繁项集互转换时的维护问题,提出3种相应算法。在挖掘最大频繁项集的过程中不断调节支持度大小,以实现其快速更新。基于最大频繁项集子集的支持计数,将现有最大频繁项集转换为频繁项集。 展开更多
关键词 最大频繁项集 数据挖掘 更新 频繁模式
下载PDF
一种基于前缀广义表的关联规则增量式更新算法 被引量:23
17
作者 杨明 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1318-1325,共8页
关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG ... 关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG List,并提出了基于PG List的关联规则挖掘 (MARBPGL)与增量式更新算法(IUABPGL) .算法MARBPGL仅须扫描数据库两遍 ,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍 ,扫描新增数据库两遍 ,且两个算法均无须生成候选项目集 ,避免了产生“知识的组合爆炸” ,提高了挖掘和维护的效率 .理论分析和实验结果表明该文提出的算法是有效可行的 . 展开更多
关键词 关联规则 增量式更新算法 前缀广义表 数据挖掘 频繁模式 数据库 APRIORI算法
下载PDF
一种新的基于FP-Tree的关联规则增量式更新算法 被引量:5
18
作者 徐文拴 辛运帏 《计算机工程与设计》 CSCD 北大核心 2006年第18期3430-3432,共3页
挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问... 挖掘关联规则是数据挖掘研究的一个重要方面,目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而维护已发现的关联规则同样是重要的。针对在事务数据库增加和最小支持度同时发生变化的情况下,如何进行关联规则的更新问题进行了研究,提出了一种新的基于频繁模式树的关联规则增量式更新算法,并对该算法进行了分析和讨论。 展开更多
关键词 数据挖掘 关联规则 增量式更新 频繁模式
下载PDF
FP-growth算法的一种改进 被引量:1
19
作者 杨萍 宋振超 《安徽工程科技学院学报(自然科学版)》 2002年第3期8-13,共6页
频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点.传统Apriori及其改进算法.要多遍扫描数据库并产生大量的候选项目集.针对Apriori算法的缺陷,HanJW(韩家炜)提出FP-growth算法,该算... 频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,频繁项目集的快速挖掘算法研究是当前研究的热点.传统Apriori及其改进算法.要多遍扫描数据库并产生大量的候选项目集.针对Apriori算法的缺陷,HanJW(韩家炜)提出FP-growth算法,该算法仅须扫描数据库两遍且无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了频繁项目集的挖掘效率.但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项目集.因而影响了频繁项目集的挖掘效率.为此,在引入F-矩阵概念之后,提出了FP-growth的一种改进算法—IFP-growth,并对改进算法的性能进行了测试.实验结果表明,IFP-growth算法优于FP-growth. 展开更多
关键词 频繁项目集 FP-GROWTH算法 改进算法 频繁模式 快速挖掘算法 数据库 APRIORI算法 选项 实验结果 知识
下载PDF
基于MapReduce的关联规则并行增量更新算法 被引量:10
20
作者 杨勇 高松松 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2014年第5期670-678,共9页
针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题。在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP-tree)的基础上,引入MapReduce并行编程模型,提出了一个面向大数据的并行的关联规则... 针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题。在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP-tree)的基础上,引入MapReduce并行编程模型,提出了一个面向大数据的并行的关联规则增量更新算法(parallel fast updated frequent pattern tree,PFUFP-tree)。该算法通过构建原始事务数据的分块索引,从而使得在每次增量更新时,能够最小化地扫描原始事务数据库,提高了挖掘效率;同时采用动态负载均衡的项目分组策略来优化并行计算过程中的项集分组问题,从而保证分布式集群中节点之间的负载均衡;实验结果证明,提出的算法是有效的和高效的,适用于动态增长的大数据环境。 展开更多
关键词 关联规则 大数据 增量更新 MAPREDUCE 快速更新频繁模式(fufp-tree)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部