期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
基于FP-Tree有效挖掘最大频繁项集 被引量:68
1
作者 颜跃进 李舟军 陈火旺 《软件学报》 EI CSCD 北大核心 2005年第2期215-222,共8页
最大频繁项集的挖掘过程中,在最小支持度较小的情况下,超集检测是算法的主要耗时操作.提出了最大频繁项集挖掘算法 FPMFI(frequent pattern tree for maximal frequent item set)使用基于投影进行超集检测的机制,有效地缩减了超集检测... 最大频繁项集的挖掘过程中,在最小支持度较小的情况下,超集检测是算法的主要耗时操作.提出了最大频繁项集挖掘算法 FPMFI(frequent pattern tree for maximal frequent item set)使用基于投影进行超集检测的机制,有效地缩减了超集检测的时间.另外,算法FPMFI通过删除FP子树(conditional frequent pattern tree)的冗余信息,有效地压缩了 FP 子树的规模,减少了遍历的开销.分析表明,算法 FPMFI 具有优越性.实验比较说明,在最小支持度较小时,算法 FPMFI 的性能优于同类算法 1 倍以上. 展开更多
关键词 最大频繁项集 频繁模式树 超集检测 最大频繁项集投影
下载PDF
基于频繁模式树的约束最大频繁项集挖掘算法 被引量:15
2
作者 花红娟 张健 陈少华 《计算机工程》 CAS CSCD 北大核心 2011年第9期78-80,共3页
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖... 多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。 展开更多
关键词 数据挖掘 最大频繁项集 约束最大频繁项集 频繁模式树 项约束
下载PDF
基于游程编码的最大频繁项集挖掘算法 被引量:1
3
作者 王茂华 郝云力 储小静 《赤峰学院学报(自然科学版)》 2015年第19期49-51,共3页
最大频繁项集的挖掘是数据挖掘领域的一个重要的研究方向.本文提出了一种基于游程编码的最大频繁项集的挖掘算法.该算法只需扫描一次数据库,将数据库转换为0-1游程编码表示的形式,并以链表数组存储转换后的数据库.使用深度优先搜索得到... 最大频繁项集的挖掘是数据挖掘领域的一个重要的研究方向.本文提出了一种基于游程编码的最大频繁项集的挖掘算法.该算法只需扫描一次数据库,将数据库转换为0-1游程编码表示的形式,并以链表数组存储转换后的数据库.使用深度优先搜索得到所有的局部最大频繁项集.实验结果表明,该算法的时间开销优于FPMAX算法. 展开更多
关键词 最大频繁项集 游程编码 深度优先搜索 局部最大频繁项集
下载PDF
基于AFOPT-tree的最大频繁项集挖掘
4
作者 周爱武 王浩 温春林 《微型机与应用》 2014年第11期86-88,共3页
在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映... 在最大频繁项集的挖掘过程中,尤其在数据规模庞大并且最小支持度较小的情况下,超集检测成为算法运行的主要时间消耗,提出最大频繁项集算法A-MFI,其通过优化基于投影的超集检测机制有效地减少了超集检测的时间。另外,将事务数据库数据映射至一种压缩的AFOPT-tree结构,该结构结合自顶向下的遍历策略,具有更小的时间开销。 展开更多
关键词 最大频繁项集 关联规则 超集检测 最大频繁项集投影
下载PDF
共现聚类分析的新方法:最大频繁项集挖掘 被引量:22
5
作者 徐硕 乔晓东 +2 位作者 朱礼军 张运良 薛春香 《情报学报》 CSSCI 北大核心 2012年第2期143-150,共8页
针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,... 针对某一领域的文献,如果两个研究对象同现的频率越高,则通常假设二者存在联系的可能性越大。从而促使共词分析、文献共引分析以及文献作者共著分析等共现分析方法的流行。然而,传统共现分析三个阶段中的前两个阶段存在一定的缺陷,从而导致最后得到的共现聚类分析的结果可能存在一定的误导性。为克服该缺陷,本文从关联规则挖掘领域引入了一种新的共现聚类分析方法——最大频繁项集挖掘,它将传统共现分析法的三个阶段压缩为一个阶段,充分利用了可以利用的各种信息,克服了传统方法的缺陷。通过实验分析发现,设置合适的最小支持度阈值,基本上可以得到比较满意的结果。 展开更多
关键词 共现分析 共词分析 聚类分析 最大频繁项集 层次聚类
下载PDF
一种挖掘最大频繁项集的深度优先算法 被引量:20
6
作者 颜跃进 李舟军 陈火旺 《计算机研究与发展》 EI CSCD 北大核心 2005年第3期462-467,共6页
最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生... 最大频繁项集挖掘是许多数据挖掘应用中的重要问题.提出一种新的深度优先搜索最大频繁项集的算法.该算法采用位图数据格式,结合了流行的各种有效剪枝技术,并使用局部最大频繁项集来进行高效的超集存在判断,明显地加速了最大频繁项集的生成,从而降低了CPU时间. 展开更多
关键词 最大频繁项集 深度优先搜索 位图 前瞻剪枝
下载PDF
蚁群算法在最大频繁项集挖掘问题中的应用 被引量:9
7
作者 宋洁 刘华 +1 位作者 谭庆 顾军华 《计算机工程与设计》 CSCD 北大核心 2008年第20期5290-5292,共3页
最大频繁项集的挖掘在关联规则挖掘中起着非常重要的作用,将其抽象为带约束条件的子集问题,利用蚁群算法进行求解。实验结果表明,与传统的Apriori算法相比,在最小支持度较小的情况下,蚁群算法具有较快的挖掘速度,在大部分情况下能够获... 最大频繁项集的挖掘在关联规则挖掘中起着非常重要的作用,将其抽象为带约束条件的子集问题,利用蚁群算法进行求解。实验结果表明,与传统的Apriori算法相比,在最小支持度较小的情况下,蚁群算法具有较快的挖掘速度,在大部分情况下能够获得所有的最大频繁项集,实验表明了蚁群算法在求解最大频繁项集挖掘问题上的有效性。 展开更多
关键词 关联规则 最大频繁项集 蚁群算法 正反馈机制 启发式信息
下载PDF
基于向量的数据流滑动窗口中最大频繁项集挖掘 被引量:7
8
作者 徐嘉莉 陈佳 +2 位作者 胡庆 黄波 郭红霞 《计算机应用研究》 CSCD 北大核心 2012年第3期837-840,共4页
针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩... 针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。 展开更多
关键词 数据流 最大频繁项集 滑动窗口 向量
下载PDF
在线挖掘数据流滑动窗口中最大频繁项集 被引量:9
9
作者 敖富江 颜跃进 +1 位作者 刘宝宏 黄柯棣 《系统仿真学报》 CAS CSCD 北大核心 2009年第4期1134-1139,共6页
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪... 相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—"子集等价剪枝技术",有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。 展开更多
关键词 数据流 最大频繁项集 在线挖掘 滑动窗口 文法顺序FP-Tree
下载PDF
改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA 被引量:16
10
作者 杨鹏坤 彭慧 +1 位作者 周晓锋 孙玉庆 《计算机应用》 CSCD 北大核心 2015年第3期775-778,共4页
针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头... 针对最大频繁项目集挖掘算法(DMFIA)当候选项目集维数高而最大频繁项目集维数较低的情况下要产生大量的候选项目集的缺点,提出了一种改进的基于频繁模式树(FP-tree)结构的最大频繁项目集挖掘算法——FPMFIA。该算法根据FP-tree的项目头表,采用自底向上的搜索策略逐层挖掘最大频繁项目集,从而加速每次对候选集计数的操作。在挖掘时根据每层的条件模式基产生维数较低的非频繁项目集,尽早对候选项目集进行剪枝和降维,可大量减少候选项目集的数量。同时在挖掘时充分利用最大频繁项集的性质,减少搜索空间。通过算法在不同支持度下挖掘时间的对比可知,算法FP-MFIA在最小支持度较低的情况下时间效率是DMFIA以及基于降维的最大频繁模式挖掘算法(BDRFI)的2倍以上,说明FP-MFIA在候选集维数较高的时候优势明显。 展开更多
关键词 最大频繁项集 频繁模式树 数据挖掘 关联规则 频繁项集
下载PDF
项约束先过滤的最大频繁项集挖掘算法 被引量:8
11
作者 姚全珠 李如琼 王美君 《计算机工程》 CAS CSCD 2012年第4期73-75,共3页
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数... 在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。 展开更多
关键词 关联规则 最大频繁项集 项约束 垂直数据格式 深度优先 稠密数据库
下载PDF
数据流中基于滑动窗口的最大频繁项集挖掘算法 被引量:4
12
作者 杨路明 刘立新 +1 位作者 毛伊敏 谢东 《计算机应用研究》 CSCD 北大核心 2010年第2期519-522,共4页
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和... 挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。 展开更多
关键词 数据流 数据挖掘 最大频繁项集 滑动窗口 位图
下载PDF
基于图论的最大频繁项集挖掘 被引量:3
13
作者 宋旭东 翟坤 +2 位作者 刘晓冰 王亚伟 张通学 《计算机应用研究》 CSCD 北大核心 2007年第11期43-45,99,共4页
利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的... 利用有向项集图来存储事务数据库中有关频繁项集的信息,提出了有向项集图的三叉链表式存储结构和基于有向项集图的最大频繁项集挖掘算法。它不仅实现了事务数据库的一次扫描,减少了I/O代价,而且可以同时解决好稀疏数据库和稠密数据库的最大频繁项集挖掘问题。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 有向项集 三叉链表式存储结构 挖掘算法
下载PDF
基于位阵的更新最大频繁项集算法 被引量:4
14
作者 胡斌 蒋外文 +2 位作者 蔡国民 黄天强 卓月明 《计算机工程》 CAS CSCD 北大核心 2007年第3期59-61,共3页
讨论了最大频繁项集的增量式更新问题,提出最大频繁项目集更新算法FAUMFI,并举例说明了算法的执行过程。该算法充分利用已建立的BitMatrix和已挖掘的最大频繁项目集,对已挖掘的最大频繁项目集进行高效维护。
关键词 最大频繁项集 数据挖掘 增量式更新
下载PDF
基于FP树的全局最大频繁项集挖掘算法 被引量:16
15
作者 王黎明 赵辉 《计算机研究与发展》 EI CSCD 北大核心 2007年第3期445-451,共7页
挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用... 挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整个数据库,而且大部分算法是单机算法,全局最大频繁项集挖掘算法并不多见.为此提出MGMF算法,该算法利用FP-树结构,类似FP-树挖掘方法,一遍就可以挖掘出所有的最大频繁项集,并且超集检测非常简单、快捷.另外MGMF算法采用了分布式PDDM算法播报消息的思想,具有很好的拓展性和并行性.实验证明MGMF算法是有效可行的. 展开更多
关键词 数据挖掘 FP-树 分布式数据库 最大频繁项集 频繁模式树
下载PDF
不确定数据流最大频繁项集挖掘算法研究 被引量:9
16
作者 刘慧婷 候明利 +1 位作者 赵鹏 姚晟 《计算机工程与应用》 CSCD 北大核心 2016年第19期72-77,93,共7页
对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研... 对于大型数据,频繁项集挖掘显得庞大而冗余,挖掘最大频繁项集可以减少挖出的频繁项集的个数。可是对于不确定性数据流,传统判断项集是否频繁的方法已不能准确表达项集的频繁性,而且目前还没有在不确定数据流上挖掘最大频繁项集的相关研究。因此,针对上述不足,提出了一种基于衰减模型的不确定性数据流最大频繁项集挖掘算法TUFSMax。该算法采用标记树结点的方法,使得算法不需要超集检测就可挖掘出所有的最大频繁项集,节约了超集检测时间。实验证明了提出的算法在时间和空间上具有高效性。 展开更多
关键词 不确定性数据流 最大频繁项集 超集检测
下载PDF
基于索引数组与集合枚举树的最大频繁项集挖掘算法 被引量:4
17
作者 宋威 杨炳儒 +1 位作者 徐章艳 侯伟 《计算机科学》 CSCD 北大核心 2007年第7期146-149,共4页
由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树... 由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 索引数组 集合枚举树
下载PDF
用有序FP-tree挖掘最大频繁项集 被引量:7
18
作者 于红 王秀坤 孟军 《控制与决策》 EI CSCD 北大核心 2007年第5期520-524,共5页
提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径... 提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径对挖掘算法进行优化.实验结果表明,该算法对于浓密数据集中挖掘长模式具有较好的性能. 展开更多
关键词 最大频繁项集 有序FP-tree数据挖掘 MFIM算法
下载PDF
基于父子等价剪枝策略的最大频繁项集挖掘 被引量:3
19
作者 张志刚 黄刘生 +1 位作者 金宗安 项莉萍 《计算机工程》 CAS CSCD 2013年第4期219-221,225,共4页
在传统剪枝策略中,具有相同事务集的父子结点搜索空间没有充分剪枝,效率较低。为此,提出父子等价的剪枝策略。采用深度优先搜索集合枚举树,对于父子结点中具有相同事务集的搜索空间进行剪枝,有效地缩小搜索空间,减少频繁项计算的次数,... 在传统剪枝策略中,具有相同事务集的父子结点搜索空间没有充分剪枝,效率较低。为此,提出父子等价的剪枝策略。采用深度优先搜索集合枚举树,对于父子结点中具有相同事务集的搜索空间进行剪枝,有效地缩小搜索空间,减少频繁项计算的次数,给出基于该剪枝策略的最大频繁项集挖掘算法。实验结果表明,该算法可缩短同一支持度下的最大频繁项集挖掘时间。 展开更多
关键词 数据挖掘 最大频繁项集 剪枝策略 最小支持度 深度优先 关联规则
下载PDF
基于有序FP-tree的最大频繁项集挖掘算法 被引量:5
20
作者 李少华 吕志旺 +1 位作者 车德勇 周宁 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2016年第2期65-69,共5页
通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析... 通过分析有序FP-tree与MFI之间的关联关系,提出一种高效的MFI挖掘算法(MMFI),使其在挖掘过程中不但避免了条件频繁模式树的构建,也省略了超集检测的过程.提出了两种预剪枝策略,该策略能够有效地缩短算法执行的时间复杂度.结合理论分析和实验数据发现MMFI算法比传统算法快速、合理. 展开更多
关键词 数据挖掘 FP-TREE 最大频繁项集 关联规则
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部