期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于最大频繁模式挖掘的多段支持度数据集成系统 被引量:1
1
作者 何昀 陈伟 +1 位作者 张继夫 张川 《信息与电脑》 2023年第3期129-131,共3页
为减少多段支持度数据集成耗时,提高多段支持度数据集成效率,本文提出了一种全新的多段支持度数据集成系统。综合考虑多段支持度数据的特征,搭建了与数据集成需求契合度较高的硬件运行环境。在此基础上,基于最大频繁模式挖掘算法,设计... 为减少多段支持度数据集成耗时,提高多段支持度数据集成效率,本文提出了一种全新的多段支持度数据集成系统。综合考虑多段支持度数据的特征,搭建了与数据集成需求契合度较高的硬件运行环境。在此基础上,基于最大频繁模式挖掘算法,设计数据流处理模块,输出挖掘的数据流频繁项集。设计多段支持度数据实时加载模块,抽取点对点同步数据,再引入5G专网数字孪生模型理念,构建多段支持度数据库,分析、集成与存储数据。根据系统测试结果可知,设计系统应用后,集成数据平均时耗最多不超过1.5 s,集成效率得到了提高。 展开更多
关键词 最大频繁模式挖掘 多段支持度 数据集成 5G专网数字孪生模型
下载PDF
基于频繁模式树的约束最大频繁项集挖掘算法 被引量:15
2
作者 花红娟 张健 陈少华 《计算机工程》 CAS CSCD 北大核心 2011年第9期78-80,共3页
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖... 多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。 展开更多
关键词 数据挖掘 最大频繁项集 约束最大频繁项集 频繁模式树 项约束
下载PDF
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
3
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 WEB使用挖掘 最大频繁访问模式 有向树 WEB日志
下载PDF
一种改进的高维孤立点挖掘入侵检测方法 被引量:4
4
作者 申利民 孙中魁 +2 位作者 陈磊 冯佳音 李志明 《小型微型计算机系统》 CSCD 北大核心 2020年第12期2636-2640,共5页
入侵检测系统中原始数据多为高维数据,针对基于频繁模式高维孤立点挖掘算法不易获取完全频繁模式和时间复杂度高等问题,提出了一种基于最大频繁模式因子的高维孤立点挖掘算法获取孤立点集,并对孤立点集合进行进一步分析获取入侵检测的... 入侵检测系统中原始数据多为高维数据,针对基于频繁模式高维孤立点挖掘算法不易获取完全频繁模式和时间复杂度高等问题,提出了一种基于最大频繁模式因子的高维孤立点挖掘算法获取孤立点集,并对孤立点集合进行进一步分析获取入侵检测的攻击模式.利用NSL-KDD数据集进行实验,和相关工作对比,结果表明所提出的方法在检测精确度和复杂度都具有优异的表现. 展开更多
关键词 入侵检测 高维数据 孤立点挖掘 最大频繁模式
下载PDF
最大频繁模式的快速挖掘与更新算法 被引量:3
5
作者 阮幼林 李庆华 刘干 《计算机工程与应用》 CSCD 北大核心 2005年第24期23-26,143,共5页
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文... 挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的方法,而产生大量候选和动态创建大量FP-Tree的代价太高,特别是在支持度阈值较小或存在长模式时。因此,文章提出了一种最大频繁模式的快速挖掘算法DMFP及更新算法IUMFP。DMFP算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。算法IUMFP充分利用以前的挖掘结果减少发现更新数据中新的最大频繁模式的代价。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
下载PDF
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
6
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
下载PDF
最大目标频繁模式挖掘算法研究 被引量:2
7
作者 李清勇 秦亮曦 +1 位作者 施智平 史忠植 《计算机工程与应用》 CSCD 北大核心 2004年第33期184-188,共5页
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎样根据用户需求直接挖掘用户感兴趣的目标模式是该文的研究目标。文章在FP-树的基础上设计了紧缩的、非... 传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎样根据用户需求直接挖掘用户感兴趣的目标模式是该文的研究目标。文章在FP-树的基础上设计了紧缩的、非冗余的TFP-树,它能有效过滤与目标模式无关的项和事务,而仅保留与目标模式相关的信息,缩小TFP-树的大小规模。同时根据TFP-树的规律和特点,笔者设计了最大目标频繁模式挖掘算法,算法的结果模式具有以下两个特点:(1)满足用户需求的目标模式;(2)最大模式。该实验结果验证了TFP-树算法是有效的,而且显著改善了FP-树算法的性能。 展开更多
关键词 数据挖掘 频繁模式 最大目标频繁模式 TFP-树 FP-树
下载PDF
一种最大频繁模式的快速挖掘算法 被引量:3
8
作者 王运鹏 胡修林 阮幼林 《计算机应用研究》 CSCD 北大核心 2006年第10期86-88,共3页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,而不需要创建条件模式树,从而大大提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-TREE 前缀树 数据挖掘
下载PDF
改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA 被引量:16
9
作者 杨鹏坤 彭慧 +1 位作者 周晓锋 孙玉庆 《计算机应用》 CSCD 北大核心 2015年第3期775-778,共4页
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头... 针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。 展开更多
关键词 最大频繁项集 频繁模式树 数据挖掘 关联规则 非频繁项集
下载PDF
基于频繁模式树的约束最大频繁项目集挖掘算法研究 被引量:4
10
作者 陈耿 朱玉全 +2 位作者 宋余庆 陆介平 孙志挥 《应用科学学报》 CAS CSCD 北大核心 2006年第1期64-69,共6页
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快... 目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的. 展开更多
关键词 关联规则 项约束 最大频繁项目集 频繁模式树 增量式更新
下载PDF
基于FP树的全局最大频繁项集挖掘算法 被引量:16
11
作者 王黎明 赵辉 《计算机研究与发展》 EI CSCD 北大核心 2007年第3期445-451,共7页
挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用... 挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用FP-树结构,类似FP-树挖掘方法,一遍就可以挖掘出所有的最大频繁项集,并且超集检测非常简单、快捷.另外MGMF算法采用了分布式PDDM算法播报消息的思想,具有很好的拓展性和并行性.实验证明MGMF算法是有效可行的. 展开更多
关键词 数据挖掘 FP-树 分布式数据库 最大频繁项集 频繁模式树
下载PDF
关联规则中基于降维的最大频繁模式挖掘算法 被引量:13
12
作者 钱雪忠 惠亮 《计算机应用》 CSCD 北大核心 2011年第5期1339-1343,共5页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算法改传统的FP-tree为数字频繁模式树DFP-tree,提高了超集检验的效率;采用的预测剪枝策略减少了挖掘的次数;基于降低项集维度的挖掘方式,减少了候选项的数目,避免了递归地产生条件频繁模式树,提高了算法的效率。实验结果表明,BDRFI的效率是同类算法的2~8倍。 展开更多
关键词 关联规则 数据挖掘 最大频繁项集 频繁模式树 降维
下载PDF
基于FP-tree的最大频繁项集挖掘算法 被引量:4
13
作者 蒋翠清 胡俊妍 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第9期1387-1391,共5页
现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree... 现有的最大频繁项集挖掘算法在支持度阈值较大情况下已达到较高性能,但在支持度阈值较小时,由于候选项集的快速增长,其性能往往不理想。文章提出了一种基于频繁模式树(FP-tree)存储结构的最大频繁项集挖掘算法——DMFIF算法,将FP-tree各分枝作为初始候选项集,并按维数和支持度递减排序,结合子集剪枝策略,自顶向下搜索挖掘最大频繁项集。实验结果表明,该算法在低支持度阈值下稠密数据集中挖掘长模式具有较好性能。 展开更多
关键词 数据挖掘 知识发现 最大频繁项集挖掘算法 模式发现
下载PDF
基于FP-Tree的最大频繁项目集更新挖掘算法 被引量:5
14
作者 杨君锐 赵群礼 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第11期88-90,共3页
发现最大频繁项目集是多种数据挖掘应用中的重要问题 .在应用中用户需要调整最小支持度 ,以发现更有用的最大频繁项目集 .为此提出了一种最大频繁项目集更新算法 (UMFPA) ,该算法通过对频繁模式树(FP Tree)中的频繁项目头表 (HTable)增... 发现最大频繁项目集是多种数据挖掘应用中的重要问题 .在应用中用户需要调整最小支持度 ,以发现更有用的最大频繁项目集 .为此提出了一种最大频繁项目集更新算法 (UMFPA) ,该算法通过对频繁模式树(FP Tree)中的频繁项目头表 (HTable)增加两个域 ,从而将减少在数据库不变而最小支持度变化的情况下的更新挖掘最大频繁项目集的费用 .实验结果表明 。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树 最小支持度
下载PDF
一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法 被引量:8
15
作者 尹治华 张大鹏 +1 位作者 谭明 王新生 《济南大学学报(自然科学版)》 北大核心 2017年第2期111-117,共7页
为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁... 为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选集计数的操作。在经典数据集mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树 非频繁项目集
下载PDF
一种约束最大频繁项目集挖掘算法 被引量:2
16
作者 李忠哗 吴聪聪 何丕廉 《微电子学与计算机》 CSCD 北大核心 2007年第11期70-72,76,共4页
提出了一种基于频繁模式矩阵(FP-array)的约束最大频繁项目集挖掘及其更新算法。算法只扫描事务数据库一遍,把满足约束条件的所有事务转换成一个频繁模式矩阵,显著缩小了FP-array的大小规模。挖掘过程采用逻辑运算,在效率上有独特的优... 提出了一种基于频繁模式矩阵(FP-array)的约束最大频繁项目集挖掘及其更新算法。算法只扫描事务数据库一遍,把满足约束条件的所有事务转换成一个频繁模式矩阵,显著缩小了FP-array的大小规模。挖掘过程采用逻辑运算,在效率上有独特的优势。实验结果表明该算法是快速有效的。 展开更多
关键词 关联规则 约束条件 频繁模式矩阵 最大频繁项目集 算法
下载PDF
一种不产生候选集的最大频繁集快速挖掘算法 被引量:4
17
作者 杨君锐 赵群礼 《微电子学与计算机》 CSCD 北大核心 2004年第11期125-128,共4页
发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP-Tree(FrequentPat鄄ternTree)的快速发现最大频繁项目集算法MFP-growth(MaximumFrequentPatterngrowth),其发现过程中不需要产生候选(项目)集,从而提高了挖... 发现最大频繁(项目)集是关联规则挖掘中的重要问题。提出一个基于频繁模式树FP-Tree(FrequentPat鄄ternTree)的快速发现最大频繁项目集算法MFP-growth(MaximumFrequentPatterngrowth),其发现过程中不需要产生候选(项目)集,从而提高了挖掘效率。由实验结果表明,此算法在发现最大频繁项目集方面具有很好的性能。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 频繁模式树
下载PDF
关联规则中FP-tree的最大频繁模式非检验挖掘算法 被引量:5
18
作者 惠亮 钱雪忠 《计算机应用》 CSCD 北大核心 2010年第7期1922-1925,共4页
基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使... 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。 展开更多
关键词 关联规则 数据挖掘 频繁模式树 最大频繁项集 超集检验
下载PDF
最大频繁模式的挖掘算法 被引量:6
19
作者 徐欣 阮幼林 《舰船电子工程》 2009年第3期102-106,共5页
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存... 挖掘最大频繁模式是多种数据挖掘应用中的关键问题。采用Apriori类的候选生成-检验方法或基于FP-Tree的挖掘方法需要产生大量候选或动态创建大量条件模式树,代价太高。因此,提出一种挖掘最大频繁模式的新算法。该算法利用前缀树压缩存放数据,并通过调整前缀树中节点信息和节点链直接在前缀树上采用深度优先的策略进行挖掘,既不需要生成候选也不需要创建条件模式树,提高了挖掘效率。 展开更多
关键词 最大频繁模式 FP-Tree前缀树
下载PDF
一种分布环境中最大频繁项目集挖掘算法 被引量:1
20
作者 李忠哗 何丕廉 《微电子学与计算机》 CSCD 北大核心 2006年第9期162-164,共3页
挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法... 挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递侯选最大频繁项目集的方法。实验表明该算法是有效的并行算法。 展开更多
关键词 分布数据库 数据挖掘 最大频繁项目集 频繁模式树
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部