期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于改进FP-tree的最大频繁项集挖掘算法 被引量:14
1
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖... 现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树
下载PDF
关联规则中FP-tree的最大频繁模式非检验挖掘算法 被引量:5
2
作者 惠亮 钱雪忠 《计算机应用》 CSCD 北大核心 2010年第7期1922-1925,共4页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。 展开更多
关键词 关联规则 数据挖掘 频繁模式树 最大频繁项集 超集检验
下载PDF
关联规则中改进FP-tree的最大频繁模式挖掘算法 被引量:3
3
作者 钱雪忠 惠亮 《计算机工程与设计》 CSCD 北大核心 2010年第21期4635-4638,共4页
关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法... 关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法DFP—Max。该算法使用预测、剪枝的策略减少条件FP—tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率。实验结果表明,在支持度相对较小情况下,DFP—Max的效率是同类算法的2-5倍。 展开更多
关键词 关联规则 数据挖掘 FP—tree 最大频繁项集 超集检验
下载PDF
基于FP-tree最大频繁模式超集挖掘算法 被引量:3
4
作者 王君 任永功 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期33-36,41,共5页
数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无... 数据挖掘应用中的最大频繁项集挖掘算法大多存在候选项目集冗余问题,造成时间和空间的浪费.针对此问题,通过构造条件FP-tree,对不符合要求的项目进行剪除并对MFIT算法进行改进,提出一种基于FP-tree的最大频繁模式超集挖掘算法.此算法无需产生大量的候选集,同时减少数据集扫描次数,降低数据库遍历时间,提高算法效率.实验证明,此算法在降低候选项目集冗余度的同时有效减少了算法运行时间. 展开更多
关键词 数据挖掘 最大频繁项目集 条件频繁模式树 超集检测
下载PDF
改进的最大频繁项集挖掘算法 被引量:2
5
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2010年第18期4009-4011,4032,共4页
为了提高挖掘关联规则的效率,提出基于改进FP-Tree结构的最大频繁项集挖掘算法。介绍并分析了挖掘最大频繁项集的过程和现有算法,指出现有算法中耗时的关键步骤。克服了MMFI算法中需要反复从头表出发沿相同项目结点链搜索右侧结点的缺点... 为了提高挖掘关联规则的效率,提出基于改进FP-Tree结构的最大频繁项集挖掘算法。介绍并分析了挖掘最大频繁项集的过程和现有算法,指出现有算法中耗时的关键步骤。克服了MMFI算法中需要反复从头表出发沿相同项目结点链搜索右侧结点的缺点,提出一种改进的最大频繁项集挖掘算法IMMFI。通过在有序FP-Tree中引入叶子链,用沿叶子链搜索取代沿同层结点链搜索,有效地减少了搜索的次数,提高了算法的效率。实验结果表明了该算法的性能良好。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树
下载PDF
一种改进的最大频繁项集挖掘算法 被引量:2
6
作者 胡德敏 赵瑞可 《计算机应用与软件》 CSCD 北大核心 2012年第12期186-188,共3页
研究基于条件模式基排序的最大频繁项集挖掘算法。通常在基于FP-tree(frequent pattern tree)的最大频繁项集挖掘算法中,影响执行效率的主要是递归和超集检测。因此提出了改进的最大频繁项集挖掘算法S-FP-MFI(sorted frequent pattern t... 研究基于条件模式基排序的最大频繁项集挖掘算法。通常在基于FP-tree(frequent pattern tree)的最大频繁项集挖掘算法中,影响执行效率的主要是递归和超集检测。因此提出了改进的最大频繁项集挖掘算法S-FP-MFI(sorted frequent pattern tree for maximal frequent item set),根据条件模式基含有的项目数对条件模式基进行动态排序,以减少递归次数;另外基于MFI-tree(maximalfrequent item tree)的投影策略减少了超集检测时间。实验表明S-FP-MFI算法在支持度较小的情况下,具有优越性。 展开更多
关键词 递归 最大频繁项集 频繁模式树 条件模式基 超集检测
下载PDF
基于绩效管理的最大频繁模式挖掘研究 被引量:1
7
作者 晏明春 谢辉 《计算机工程与应用》 CSCD 北大核心 2006年第5期213-216,共4页
提出了对绩效管理关键绩效指标(KPI)的确定中挖掘最大频繁集的一种方法。该方法采用了位图数据格式;根据绩效管理中数据的特点,由用户的需求导出FP-tree。通过分析Apriori方法和FP-growth方法的优缺点,结合各种有效剪枝技术,对传统挖掘... 提出了对绩效管理关键绩效指标(KPI)的确定中挖掘最大频繁集的一种方法。该方法采用了位图数据格式;根据绩效管理中数据的特点,由用户的需求导出FP-tree。通过分析Apriori方法和FP-growth方法的优缺点,结合各种有效剪枝技术,对传统挖掘算法进行了改进,加速了FP-tree上的最大频繁集的生成,以适应绩效管理的应用环境。最后给出了实例以显示处理过程及效率。 展开更多
关键词 KPI 最大频繁集 位图 FP—tree 超集存在判断
下载PDF
基于AO算法的数据流频繁项集挖掘 被引量:5
8
作者 文凯 耿小海 +1 位作者 朱璐伟 许萌萌 《计算机工程与科学》 CSCD 北大核心 2020年第12期2259-2264,共6页
针对传统数据流频繁项集挖掘算法在支持度更新、窗口更新方式、频繁k-项集挖掘等方面存在的一系列问题,造成空间和时间效率不高,改进研究了一种高效挖掘数据流频繁项集的AO算法。采用滑动窗口思想,对数据流分块挖掘;在满窗口有新数据流... 针对传统数据流频繁项集挖掘算法在支持度更新、窗口更新方式、频繁k-项集挖掘等方面存在的一系列问题,造成空间和时间效率不高,改进研究了一种高效挖掘数据流频繁项集的AO算法。采用滑动窗口思想,对数据流分块挖掘;在满窗口有新数据流入时,采用取余插入完成数据更新;挖掘频繁k-项集采用And Operation求解支持度,并在挖掘过程结合超集检测,极大地提高了挖掘效率。实验结果表明,该算法在时间和空间效率上均有一定的优越性。 展开更多
关键词 数据流 超集检测 频繁项集 与运算
下载PDF
最大亚频繁模式挖掘算法研究 被引量:1
9
作者 张海清 刘胤田 《计算机工程》 CAS CSCD 北大核心 2011年第14期62-64,共3页
为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MS... 为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MSFP-tree的最大亚频繁模式超集检测和剪枝策略及对MSFP-mining挖掘性能的实验验证。实验结果表明,该算法利用差别频繁度实现核心项集、附加频繁项集、补充频繁项集的阶段性求取和组合,在保证项集频繁度基础上实现最大亚频繁模式挖掘,扩展频繁模式规模。 展开更多
关键词 模式挖掘 最大亚频繁模式 数据集 超集检测 MSFP-tree结构
下载PDF
基于AFOPT-tree的最大频繁项集挖掘
10
作者 周爱武 王浩 温春林 《微型机与应用》 2014年第11期86-88,共3页
在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映... 在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映射至一种压缩的AFOPT-tree结构,该结构结合自顶向下的遍历策略,具有更小的时间开销。 展开更多
关键词 最大频繁项集 关联规则 超集检测 最大频繁项集投影
下载PDF
基于Nodeset的最大频繁项集挖掘算法 被引量:6
11
作者 林晨 顾君忠 《计算机工程》 CAS CSCD 北大核心 2016年第12期204-207,216,共5页
递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频繁项集挖掘算法——MFIN算法。该算法采用Nodeset数据结构对POC-Tree的节点编码,将集合枚举树作为搜索空... 递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频繁项集挖掘算法——MFIN算法。该算法采用Nodeset数据结构对POC-Tree的节点编码,将集合枚举树作为搜索空间,避免递归遍历和条件FP-Tree构建的时间开销。设计提前停止方法提高求解Nodeset交集的效率,采用父等价剪枝技术和前瞻剪枝技术缩小搜索空间。对基于MFI-Tree的投影策略进行改进,提升超集检测的速度。实验结果表明,MFIN算法在mushroom,pumsb,webdocs数据集上的运行时间及执行效率等总体性能明显优于基于FP-Tree的FP-Max算法。 展开更多
关键词 最大频繁项集 关联规则 剪枝技术 前缀树 超集检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部