期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
Mining Maximal Frequent Patterns in a Unidirectional FP-tree 被引量:1
1
作者 宋晶晶 刘瑞新 +1 位作者 王艳 姜保庆 《Journal of Donghua University(English Edition)》 EI CAS 2006年第6期105-109,共5页
Because mining complete set of frequent patterns from dense database could be impractical, an interesting alternative has been proposed recently. Instead of mining the complete set of frequent patterns, the new model ... Because mining complete set of frequent patterns from dense database could be impractical, an interesting alternative has been proposed recently. Instead of mining the complete set of frequent patterns, the new model only finds out the maximal frequent patterns, which can generate all frequent patterns. FP-growth algorithm is one of the most efficient frequent-pattern mining methods published so far. However, because FP-tree and conditional FP-trees must be two-way traversable, a great deal memory is needed in process of mining. This paper proposes an efficient algorithm Unid_FP-Max for mining maximal frequent patterns based on unidirectional FP-tree. Because of generation method of unidirectional FP-tree and conditional unidirectional FP-trees, the algorithm reduces the space consumption to the fullest extent. With the development of two techniques: single path pruning and header table pruning which can cut down many conditional unidirectional FP-trees generated recursively in mining process, Unid_FP-Max further lowers the expense of time and space. 展开更多
关键词 data mining frequent pattern the maximal frequent pattern Unid _ FP-tree conditional Unid _ FP-tree.
下载PDF
基于最大频繁all-confidence模式的二次挖掘探讨药物模式组配规律
2
作者 周忠眉 《漳州师范学院学报(自然科学版)》 2012年第4期11-14,共4页
方剂配伍规律研究是方剂学难点和重点课题之一.利用all-confidence度量,挖掘最大频繁all-confidence模式.提出基于最大频繁all-confidence模式的二次挖掘方法,挖掘药物模式之间的组配规则,从而探寻药物模式之间的组配规律,辅助方剂配伍... 方剂配伍规律研究是方剂学难点和重点课题之一.利用all-confidence度量,挖掘最大频繁all-confidence模式.提出基于最大频繁all-confidence模式的二次挖掘方法,挖掘药物模式之间的组配规则,从而探寻药物模式之间的组配规律,辅助方剂配伍规律研究,并为临床组方提供规则参考.首先给出最大频繁all-confidence模式等相关的概念,其次给出基于最大频繁all-confidence模式的二次挖掘方法,最后在方剂数据库上进行实验,实验结果表明基于最大频繁all-confidence模式的二次挖掘能有效挖掘大量药物模式之间的组配规则,有利于药物模式之间组配规律的探寻. 展开更多
关键词 最大频繁all-confidence模式 方剂 药物模式 组配规律
下载PDF
New algorithm of mining frequent closed itemsets
3
作者 张亮 任永功 付玉 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期335-338,共4页
A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory an... A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory and time consuming problems. This algorithm maps the transaction database by using a Hash table,gets the support of all frequent itemsets through operating the Hash table and forms a lexicographic subset tree including the frequent itemsets.Efficient pruning methods are used to get the FC-tree including all the minimum frequent closed itemsets through processing the lexicographic subset tree.Finally,frequent closed itemsets are generated from minimum frequent closed itemsets.The experimental results show that the mapping transaction database is introduced in the algorithm to reduce time consumption and to improve the efficiency of the program.Furthermore,the effective pruning strategy restrains the number of candidates,which saves space.The results show that the algorithm is effective. 展开更多
关键词 frequent itemsets frequent closed itemsets minimum frequent closed itemsets maximal frequent closed itemsets frequent closed pattern tree
下载PDF
挖掘最大频繁模式的新方法 被引量:15
4
作者 刘君强 孙晓莹 +1 位作者 王勋 潘云鹤 《计算机学报》 EI CSCD 北大核心 2004年第10期1328-1334,共7页
由于其内在的计算复杂性 ,挖掘密集型数据集的频繁模式完全集非常困难 ,解决方案之一是挖掘最大频繁模式集 .该文在频繁模式完全集挖掘算法OpportuneProject基础上 ,提出了挖掘最大频繁模式的新算法MOP .它采用宽度与深度优先相结合的... 由于其内在的计算复杂性 ,挖掘密集型数据集的频繁模式完全集非常困难 ,解决方案之一是挖掘最大频繁模式集 .该文在频繁模式完全集挖掘算法OpportuneProject基础上 ,提出了挖掘最大频繁模式的新算法MOP .它采用宽度与深度优先相结合的混合搜索策略 ,能恰当地选择不同的支持集表示和投影方法 ,将闭合性剪裁和一般性剪裁相结合 ,并适时前窥 ,实现搜索与剪裁效率最优化 .实验表明 ,MOP效率是MaxMiner的 2~ 8倍 ,比MAFIA高 2个数量级以上 . 展开更多
关键词 知识发现 数据挖掘 最大频繁模式 关联规则 混合搜索策略 完全集挖掘算法 MOP
下载PDF
RAKING:一种高效的不确定图K-极大频繁模式挖掘算法 被引量:17
5
作者 韩蒙 张炜 李建中 《计算机学报》 EI CSCD 北大核心 2010年第8期1387-1395,共9页
由于不确定图蕴含了指数级的可能图实例,基于确定图模型的频繁图模式挖掘算法通常难以在不确定图集合上高效运行.文中提出了一种不确定图数据集上的基于随机游走的K极大频繁子模式挖掘算法.首先,将每个不确定图转换为相应的确定图并挖... 由于不确定图蕴含了指数级的可能图实例,基于确定图模型的频繁图模式挖掘算法通常难以在不确定图集合上高效运行.文中提出了一种不确定图数据集上的基于随机游走的K极大频繁子模式挖掘算法.首先,将每个不确定图转换为相应的确定图并挖掘候选频繁模式;然后,将候选频繁模式恢复为不确定图并生成极大频繁模式搜索空间;最后,通过随机游走以相同概率随机地选择K个极大频繁模式.理论分析和实验结果表明文中提出的算法能够高效地获得不确定图集合的K-极大频繁模式. 展开更多
关键词 不确定图 数据挖掘 随机游走 极大频繁模式
下载PDF
基于FP-tree的最大频繁模式挖掘算法 被引量:18
6
作者 冯志新 钟诚 《计算机工程》 CAS CSCD 北大核心 2004年第11期123-124,共2页
在FP-tree结构的基础上提出了最大频繁模式挖掘算法FP-Max。算法FP-Max只需要两次数据库扫描,挖掘过程不会产生候选项集。实验表明,算法FP-Max在挖掘密集型数据集方面是高效的。
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
下载PDF
基于改进FP-tree的最大频繁项目集挖掘算法 被引量:8
7
作者 马丽生 姚光顺 杨传健 《计算机应用》 CSCD 北大核心 2012年第2期326-329,共4页
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存... 针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。 展开更多
关键词 频繁项目集 最大频繁项目集 条件模式基 项头表 剪枝策略 压缩策略
下载PDF
SFPMax——基于排序FP树的最大频繁模式挖掘算法 被引量:26
8
作者 秦亮曦 史忠植 《计算机研究与发展》 EI CSCD 北大核心 2005年第2期217-223,共7页
FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利... FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利用最大频繁模式的性质 ,减小产生的候选最大模式的规模 ;③设置中间结果集 ,缩小检验的范围 ,从而减少检验候选最大模式的时间 实验表明 ,SFP -Max是一个高效的最大频繁模式的挖掘算法 ,对于测试的数据集 ,SFP 展开更多
关键词 数据挖掘 关联规则 排序FP-树 最大频繁模式
下载PDF
基于FP-tree的最大频繁项目集挖掘算法 被引量:4
9
作者 马丽生 邓辉文 齐逸 《计算机工程与设计》 CSCD 北大核心 2008年第2期385-388,共4页
最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使... 最大频繁项目集挖掘是数据挖掘领域最重要的基本问题之一,在分析已有算法的基础上提出了FP-MMFI算法,它是对FP-growth算法在最大频繁项目集挖掘上的扩展。提出了频繁路径的概念,用它可以有效地对FP-tree进行压缩和缩小搜索空间,同时使用投影的方法对超集检测进行了优化,减少了项目匹配的次数。最后实验结果表明,该算法在性能上优于已有的同类算法。 展开更多
关键词 数据挖掘 关联规则 频繁项目集 最大频繁项目集 频繁模式树
下载PDF
基于改进FP-tree的最大频繁项集挖掘算法 被引量:14
10
作者 陈晨 鞠时光 《计算机工程与设计》 CSCD 北大核心 2008年第24期6236-6239,共4页
现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖... 现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。 展开更多
关键词 数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树
下载PDF
基于有序树的不确定数据最大频繁项挖掘算法 被引量:7
11
作者 刘卫明 蒯海龙 +1 位作者 陈志刚 毛伊敏 《计算机工程与应用》 CSCD 北大核心 2015年第24期145-149,共5页
针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了... 针对UF-tree中项集存在的数据和路径冗余的问题,设计了有序的压缩不确定树SCUF-tree,在节点中存储元素的不同支持度,达到压缩存储空间和方便移植已有的确定数据最大频繁项集算法的目的。结合最大频繁项集挖掘算法MMFI的设计思想,提出了一种挖掘不确定最大频繁项集算法UMMFI算法,并采取逐层逐个的NBN策略挖掘不确定最大频繁项集。实验结果表明,UMMFI算法具有较好的时空效益和适应性。 展开更多
关键词 不确定数据的最大频繁项集 不确定数据最大频繁项挖掘(UMMFI)算法 有序的压缩不确定树(SCUF-tree) 逐层逐个地处理节点(NBN)策略
下载PDF
一种基于FP-树的最大频繁模式增量更新挖掘算法 被引量:3
12
作者 李忠哗 任春龙 何丕廉 《计算机应用与软件》 CSCD 北大核心 2007年第5期47-49,共3页
挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少。深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进。... 挖掘关联规则是数据挖掘领域的一个重要研究方向,人们已经提出了许多用于发现数据库中关联规则的算法,但对关联规则的增量维护问题的研究较少。深入分析了增量更新情况,使用了目前较高效的最大频繁模式挖掘算法FP-Max,并对其进行改进。基本思想:①基于FP-树;②考虑了数据集中,数据增加情况下FP-树的更新;③对FP-Max算法进行改进来更新、维护已经挖掘出来的最大频繁模式。 展开更多
关键词 数据挖掘 关联规则 频繁模式树 最大频繁模式
下载PDF
基于OWSFP-Tree的最大频繁项目集挖掘算法 被引量:5
13
作者 赵志刚 王芳 万军 《计算机工程与设计》 CSCD 北大核心 2013年第5期1687-1690,1807,共5页
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前... 为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超集检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超集检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目集 FP-TREE 条件模式树
下载PDF
特定数据最大频繁集挖掘算法 被引量:3
14
作者 王华 胡学钢 田卫东 《计算机工程》 CAS CSCD 北大核心 2008年第14期63-65,共3页
针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subsettree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以... 针对在某些限定项目数与交易长度数据的关联规则挖掘中FP-growth算法执行效率很低的问题,提出一种最大频繁模式挖掘算法,该算法引入与FP-tree结构类似的All-subsettree存储所有的最大频繁项目集,无需在扫描数据库前指定最小支持度,可以动态给定最小支持度而不用重新扫描数据库。实验结果表明,该算法在这些特定数据的挖掘中,与FP-growth相比明显提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式树 最大频繁项目集
下载PDF
基于改进的FP-tree最大频繁模式挖掘算法 被引量:4
15
作者 宁慧 王素红 +2 位作者 崔立刚 郭笑语 徐丽 《应用科技》 CAS 2016年第2期37-43,共7页
针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁... 针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁模式完全集难以挖掘的问题,文中提出了IFPmax最大频繁模式挖掘算法,在改进的IFP-tree结构的基础上,利用结点的秩进行预判断,充分利用最大频繁模式的性质对已经存在的结点进行标记,有效避免了节点的冗余遍历,提高了最大频繁模式挖掘算法的效率。实验表明,在不同的基准数据集上文中提出的算法更有效,避免了节点的冗余遍历,使最大频繁模式挖掘算法效率更高。 展开更多
关键词 挖掘 动态结点插入技术 IFP-tree 最大频繁模式 IFPmax
下载PDF
基于矩阵的最大频繁模式挖掘及其更新算法 被引量:4
16
作者 吴聪聪 李忠哗 何丕廉 《微电子学与计算机》 CSCD 北大核心 2007年第12期29-31,36,共4页
提出了一种基于矩阵的挖掘最大频繁模式的算法(FPA),只需扫描数据集一遍,不生成候选项目集。在实际应用中用户经常需要调整最小支持度阀值获得信息,为此,提出了更新挖掘算法(UFPA)。实验结果表明,这两个算法具有很好性能。
关键词 关联规则 FP—array 最大频繁模式 最小支持度
下载PDF
最小组合法挖掘最大频繁集 被引量:4
17
作者 李清峰 周鲜成 +1 位作者 王莉 周伟林 《计算机应用研究》 CSCD 北大核心 2008年第3期702-704,708,共4页
提出了与apriori和FP-tree两类算法完全不同的高效挖掘最大频繁集的算法,即最小组合算法MCA。该算法不产生候选频繁集,能大大减少计算量的开销。在此算法的研究中提出了另一个子课题,即重复数列中最小组合算法研究。
关键词 关联规则 最大频繁集 最小组合算法 重复数列中最小组合
下载PDF
移动计算环境中用户移动模式的挖掘 被引量:2
18
作者 施颖男 李德敏 蔡葛峰 《计算机工程》 CAS CSCD 北大核心 2004年第5期186-187,共2页
在移动计算中与移动用户位置相关的移动对象位置管理服务以及基于位置的移动增值服务等都离不开移动用户移动模式的挖掘。该文利用用户的移动日志,通过非二频繁项集把整个日志切割为一系列的子序列,然后把子序列分别归入频繁子序列和... 在移动计算中与移动用户位置相关的移动对象位置管理服务以及基于位置的移动增值服务等都离不开移动用户移动模式的挖掘。该文利用用户的移动日志,通过非二频繁项集把整个日志切割为一系列的子序列,然后把子序列分别归入频繁子序列和非频繁子序列这两个箱中,再分别对其进行合并和拆分处理,寻找最大频繁项集,即移动用户的最大移动模式。 展开更多
关键词 移动计算 移动模式 最大频繁序列 合并 拆分
下载PDF
分布式数据库的精简频繁模式集及其挖掘算法 被引量:2
19
作者 贾泂 刘群 姜晗 《浙江师范大学学报(自然科学版)》 CAS 2010年第2期132-137,共6页
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集... 对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集的挖掘算法.该算法具有占用空间少、通信量小等特点.最后用实例进行了证明. 展开更多
关键词 分布式数据库 关联规则的精简 频繁闭项集 最大频繁项集 全局最大频繁项集
下载PDF
基于FC-tree的频繁闭项目集挖掘算法 被引量:1
20
作者 任永功 张亮 +1 位作者 付玉 吕君义 《计算机科学》 CSCD 北大核心 2008年第9期149-152,164,共5页
目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库。本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜... 目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库。本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜索时间。此外,利用广度优先搜索和有效的剪枝策略,大大限制了候选项目集的生成,缩小了搜索空间从而提高了程序的性能。实验结果表明该算法是快速有效的。 展开更多
关键词 频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 FC-tree(频繁闭模式树)
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部