期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
Mining φ-Frequent Itemset Using FP-Tree
1
作者 李天瑞 《Journal of Modern Transportation》 2001年第1期67-74,共8页
The problem of association rule mining has gained considerable prominence in the data mining community for its use as an important tool of knowledge discovery from large scale databases. And there has been a spurt of... The problem of association rule mining has gained considerable prominence in the data mining community for its use as an important tool of knowledge discovery from large scale databases. And there has been a spurt of research activities around this problem. However, traditional association rule mining may often derive many rules in which people are uninterested. This paper reports a generalization of association rule mining called φ association rule mining. It allows people to have different interests on different itemsets that arethe need of real application. Also, it can help to derive interesting rules and substantially reduce the amount of rules. An algorithm based on FP tree for mining φ frequent itemset is presented. It is shown by experiments that the proposed methodis efficient and scalable over large databases. 展开更多
关键词 data processing databaseS φ association rule mining φ frequent itemset FP tree data mining
下载PDF
基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法 被引量:24
2
作者 崔建 李强 杨龙坡 《计算机科学》 CSCD 北大核心 2011年第4期216-220,共5页
为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有... 为进一步解决对大型事务数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁的问题,给出了一种基于垂直数据分布的改进关联规则挖掘算法,称为VARMLDb算法。该算法首先有效地把数据库分为内存可以满足要求的若干划分,然后结合有向无环图和垂直数据形式diffset差集来存储和计算频繁项集,极大地减少了存储中间结果所需的内存大小,解决了传统垂直数据挖掘算法对稠密数据库挖掘效率低下的问题,使该算法可有效地适用于大型稠密数据库的关联规则挖掘。整个算法吸取CARMA算法的优势,只需扫描两次数据库便可完成挖掘过程。实验结果表明该算法是正确的,在大型稠密数据库中,VARMLDb算法具有较高的执行效率。 展开更多
关键词 CARMA算法 DAG diffset差集 垂直数据分布 稠密数据库
下载PDF
基于Apriori算法的改进算法 被引量:15
3
作者 郭健美 宋顺林 李世松 《计算机工程与设计》 CSCD 北大核心 2008年第11期2814-2815,2820,共3页
关联规则挖掘是数据挖掘研究的一项重要内容。为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免... 关联规则挖掘是数据挖掘研究的一项重要内容。为了快速挖掘关联规则,分析了挖掘关联规则的Apriori算法,并在此基础上给出了一种改进的算法:NApriori算法,利用频繁1项集重新组织事务数据库来挖掘关联规则,此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,实验结果表明此方法比Apriori算法有更好的性能。 展开更多
关键词 数据挖掘 关联规则 频繁项集 事务数据库 最小支持数
下载PDF
项约束先过滤的最大频繁项集挖掘算法 被引量:8
4
作者 姚全珠 李如琼 王美君 《计算机工程》 CAS CSCD 2012年第4期73-75,共3页
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数... 在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。 展开更多
关键词 关联规则 最大频繁项集 项约束 垂直数据格式 深度优先 稠密数据库
下载PDF
关联规则中频繁项集高效挖掘的研究 被引量:18
5
作者 张云涛 于治楼 张化祥 《计算机工程与应用》 CSCD 北大核心 2011年第3期139-141,共3页
针对Apriori时间性能较低的缺陷,结合二项集支持度矩阵提出了Apriori改进算法Apriori-M。在扫描数据库时生成一个二项集支持度矩阵,利用矩阵的性质提高了连接和剪枝的效率;通过第二次扫描数据库就能正确地获取所有的频繁项集,并很好地... 针对Apriori时间性能较低的缺陷,结合二项集支持度矩阵提出了Apriori改进算法Apriori-M。在扫描数据库时生成一个二项集支持度矩阵,利用矩阵的性质提高了连接和剪枝的效率;通过第二次扫描数据库就能正确地获取所有的频繁项集,并很好地解决了Apriori生成无效二项集的问题。实验结果表明Apriori-M的性能优于Apriori。 展开更多
关键词 关联规则 APRIORI算法 事务数据库 频繁项 支持度矩阵
下载PDF
一种改进的关联规则挖掘算法 被引量:4
6
作者 吴志丹 赵大宇 唐恒永 《沈阳师范大学学报(自然科学版)》 CAS 2006年第3期257-259,共3页
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二... 从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率. 展开更多
关键词 关联规则 频繁项集 数据挖掘 数据库
下载PDF
基于差集的高效用项集挖掘方法 被引量:6
7
作者 黄坤 吴玉佳 李晶 《电子学报》 EI CAS CSCD 北大核心 2018年第8期1804-1814,共11页
高效用项集挖掘已成为关联规则中的一个热点研究问题.一些基于垂直结构的算法已用来挖掘高效用项集,此类算法的主要优点是将项集的事务和效用信息存储到效用列表中.在求一个项集的超集所在事务可以通过对它的子集进行一次交集运算得到.... 高效用项集挖掘已成为关联规则中的一个热点研究问题.一些基于垂直结构的算法已用来挖掘高效用项集,此类算法的主要优点是将项集的事务和效用信息存储到效用列表中.在求一个项集的超集所在事务可以通过对它的子集进行一次交集运算得到.这种算法在稀疏数据集中非常的有效.但在稠密数据集中存在一个问题,即列表中存储的事务太多,在计算用于剪枝的效用上界时,需要耗费大量的存储空间,同时也影响运行速度.并且在现有的算法中,缺乏针对稠密数据集的高效用项集挖掘算法,往往需要设置很高的最小效用阈值,影响算法的运行效率.针对此问题,提出一个新的算法D-HUI(mining High Utility Itemsets using Diffsets)以及一个新的数据结构—项集列表,首次在高效用项集挖掘中引入差集的概念.利用事务的差集求项集的效用上界,减少计算量以及存储空间,从而提高算法的运行效率.实验结果表明,提出的算法在稠密数据集中,执行速度更快,内存消耗更少. 展开更多
关键词 关联规则 高效用项集 稠密数据集 垂直结构 差集
下载PDF
高效的关联规则挖掘算法 被引量:4
8
作者 郭健美 宋顺林 肖仁财 《计算机工程与设计》 CSCD 北大核心 2008年第13期3378-3380,共3页
针对Apriori算法多次扫描数据库且生成的候选项集数量大的缺陷,提出了一种数据库优化策略,并结合修剪频繁集和连接优化策略,得到一种新的关联规则挖掘算法-NApriori算法。该算法减小了数据库的规模以及候选项集的数目,避免了连接过程中... 针对Apriori算法多次扫描数据库且生成的候选项集数量大的缺陷,提出了一种数据库优化策略,并结合修剪频繁集和连接优化策略,得到一种新的关联规则挖掘算法-NApriori算法。该算法减小了数据库的规模以及候选项集的数目,避免了连接过程中相同项目的重复比较。实验表明此方法比Apriori算法有更好的性能。 展开更多
关键词 数据挖掘 关联规则 频繁项集 事务数据库 最小支持数
下载PDF
分布式环境下约束性关联规则的快速挖掘 被引量:7
9
作者 吉根林 韦素云 《小型微型计算机系统》 CSCD 北大核心 2007年第5期882-885,共4页
研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘... 研究人员针对单机环境提出了约束性关联规则的挖掘算法,但它们不适用于分布式环境.为此本文讨论分布式环境下约束性关联规则的快速挖掘技术,提出一种基于分布式环境的约束性关联规则快速挖掘算法DCAR,其中包括局部约束性频繁项目集挖掘算法MLFC和全局约束性频繁项目集挖掘算法MGFC.该算法根据布尔约束条件产生向导集,采用一种新的候选项集生成函数Reorder-gen,该函数通过向导集高效地产生分布式环境中满足约束条件的、数量较少且完备的候选项集,并且求解全局约束性频繁项集过程中,传送局部候选项集支持数的通信量为O(n),从而提高了算法的挖掘效率.将本文提出的算法加以实现,实验结果表明DCAR算法高效可行,其效率大约是DMA-IC算法的2-3倍. 展开更多
关键词 分布式数据挖掘 分布式关联规则 分布式数据库 频繁项目集 约束项
下载PDF
φ频繁闭项目挖掘问题及其算法 被引量:3
10
作者 李天瑞 徐扬 潘无名 《西南交通大学学报》 EI CSCD 北大核心 2001年第3期225-228,共4页
关联规则挖掘问题是数据挖掘领域一个重要的研究方向 ,φ 关联规则挖掘问题是它的一种推广形式。利用闭项目集的思想 ,提出了 φ 频繁闭项目挖掘问题。它是 φ 关联规则挖掘问题的一种替代 ,并给出了一种有效的挖掘算法 ,有效解决 φ
关键词 数据库 数据处理 ψ-频繁闭项目集 关联规则 数据挖掘
下载PDF
扩展WIT-树融合Diffset策略的频繁加权项集快速挖掘算法 被引量:2
11
作者 张亚梅 张皓 +1 位作者 海本斋 廖晓飞 《计算机应用研究》 CSCD 北大核心 2015年第12期3574-3578,共5页
针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后... 针对当前算法从加权项事务数据库挖掘频繁加权项集(FWI)时效率不高的问题,提出了一种基于加权项集-Tidset树结构的FWI快速挖掘算法。首先,提出了一种加权项集-Tidset树结构;然后,使用最小加权项集阈值和向下闭合性质修剪非频繁节点;最后,利用Diffset策略允许以内存有效方式快速计算项集的加权支持度。实验结果表明,当输入数据库中FWI数较大时,提出的算法明显降低了FWI挖掘时间。相比基于先验的算法,算法平均可节省99.37%的耗时;相比基于位矩阵的加权频繁项集生成算法,提出的算法可节省99.06%的耗时,明显提升了频繁加权项集挖掘效率。 展开更多
关键词 频繁加权项集 数据挖掘 WIT-树 关联规则挖掘 Diffset策略
下载PDF
基于项目集知识库的关联规则挖掘与更新的高效算法 被引量:4
12
作者 李华君 周海岩 《计算机工程与设计》 CSCD 2004年第12期2198-2201,共4页
通过对已有的诸关联规则挖掘与更新算法进行深入的分析和研究,指出了其共同存在的问题与不足,提出了一种基于项目集知识库的关联规则挖掘与更新方法。该方法既适应当数据库D中数据不变而用户指定的最小支持度和最小置信度这两个阈值变... 通过对已有的诸关联规则挖掘与更新算法进行深入的分析和研究,指出了其共同存在的问题与不足,提出了一种基于项目集知识库的关联规则挖掘与更新方法。该方法既适应当数据库D中数据不变而用户指定的最小支持度和最小置信度这两个阈值变化的情况,也适合事务数据库D中数据发生变化的情况。当事务数据库D中数据不变时,仅需扫描数据库一次,便可建立项目集知识库KBD,然后可反复调整最小支持度和最小置信度进行关联规则挖掘与更新。而当事务数据库D中数据发生变化时,仅需扫描数据集d+和d-各一次;通过对项目集知识库KBD的更新来达到对频繁项目集和关联规则的更新。 展开更多
关键词 关联规则挖掘 事务数据库 知识库 频繁项目集 最小支持度 扫描 数据集 KBD 变化 适应
下载PDF
一个不需要产生候选集频繁集挖掘算法的研究 被引量:3
13
作者 张勇 杨玲 《吉林农业大学学报》 CAS CSCD 北大核心 2003年第3期346-349,共4页
FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比,FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori... FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比,FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori在性能上作了分析对比。 展开更多
关键词 候选集 频繁集 数据库 数据挖掘 关联规则 FP-GROWTH算法 APRIORI算法
下载PDF
分布式数据库的精简频繁模式集及其挖掘算法 被引量:2
14
作者 贾泂 刘群 姜晗 《浙江师范大学学报(自然科学版)》 CAS 2010年第2期132-137,共6页
对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集... 对分布式数据库关联规则的挖掘与精简表示进行了研究,把频繁闭项集和最大频繁项集的概念推广到分布式数据库中,提出了在分布式环境下的频繁模式集的精简表示方法,以及一种基于各站点的全局大项目集的全局频繁闭项集和全局最大频繁项集的挖掘算法.该算法具有占用空间少、通信量小等特点.最后用实例进行了证明. 展开更多
关键词 分布式数据库 关联规则的精简 频繁闭项集 最大频繁项集 全局最大频繁项集
下载PDF
基于频繁集的多层次交互式关联规则挖掘 被引量:1
15
作者 赵奕 施鹏飞 熊范纶 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第5期695-698,共4页
定义了一系列关联规则的相关概念 ,然后 ,针对现有的销售事务数据库 ,提出了一种改进的获取多层次信息方法 ,并据此对各数据进行压缩编码 ,减少处理时间 .同时 ,借助频繁集和交互式技术 ,实现多个概念层次交互式挖掘 ,以按用户实际需要... 定义了一系列关联规则的相关概念 ,然后 ,针对现有的销售事务数据库 ,提出了一种改进的获取多层次信息方法 ,并据此对各数据进行压缩编码 ,减少处理时间 .同时 ,借助频繁集和交互式技术 ,实现多个概念层次交互式挖掘 ,以按用户实际需要提取出其感兴趣的关联规则 。 展开更多
关键词 数据库 数据挖掘 频繁集 交第式 关联规则
下载PDF
垂直分布下的隐私保护频繁闭合项集挖掘算法
16
作者 明媚 缪裕青 +1 位作者 李世令 李云辉 《桂林电子科技大学学报》 2014年第4期295-299,共5页
针对垂直分布下的隐私保护关联规则挖掘算法效率低、安全性不高的问题,提出一种隐私保护频繁闭合项集的挖掘算法。算法利用挖掘频繁闭合项集代替频繁项集,IT-Tree作为搜索空间,Diffsets作为压缩结构,采用基于RSA可交换加密算法的隐私保... 针对垂直分布下的隐私保护关联规则挖掘算法效率低、安全性不高的问题,提出一种隐私保护频繁闭合项集的挖掘算法。算法利用挖掘频繁闭合项集代替频繁项集,IT-Tree作为搜索空间,Diffsets作为压缩结构,采用基于RSA可交换加密算法的隐私保护集合差集协议。实验结果表明,算法具有较好的隐私性、准确性、高效性。 展开更多
关键词 隐私保护 关联规则 频繁闭合项集 差集协议 diffsets
下载PDF
频繁项集挖掘技术述评 被引量:2
17
作者 袁鼎荣 李波 《广西民族学院学报(自然科学版)》 CAS 2005年第1期86-90,共5页
阐述了关联规则挖掘对象事务数据库的特性, 对关联规则挖掘的关键问题频繁项集的几种挖掘方法:Apriori算法、最大频繁项集的挖掘算法、基于频繁链表的频繁项集挖掘算法作了分析研究。
关键词 事务数据库 频繁项集挖掘算法 关联规则 数据挖掘
下载PDF
Apriori算法与FP-tree算法的探讨 被引量:6
18
作者 况莉莉 《淮北煤炭师范学院学报(自然科学版)》 CAS 2010年第2期44-49,共6页
在关联规则挖掘中,Apriori和FP-tree是两种最基本的算法.文章讨论这两种算法的基本思想、数据挖掘步骤、优缺点并以具体的实例描述两种算法的实现过程.深入分析这两种算法为关联规则挖掘算法的扩展和改进奠定了基础.
关键词 关联规则 APRIORI算法 FP-TREE算法 事务数据库 频繁项集
下载PDF
一种分布式数据库关联规则挖掘算法 被引量:1
19
作者 曹文梁 《计算机系统应用》 2012年第8期218-221,共4页
现有的数据挖掘算法多是集中式环境下的数据挖掘处理,但目前的大型数据库多以分布式的形式存在,针对分布式数据挖掘算法FDM及其改进算法中存在的频繁项集丢失问题和网络通信开销过高的问题,提出了一种改进的基于关联规则的分布式数据挖... 现有的数据挖掘算法多是集中式环境下的数据挖掘处理,但目前的大型数据库多以分布式的形式存在,针对分布式数据挖掘算法FDM及其改进算法中存在的频繁项集丢失问题和网络通信开销过高的问题,提出了一种改进的基于关联规则的分布式数据挖掘算法LTDM,LTDM算法引入了映射标示数组机制,可以在保证频繁项集完整性的同时降低网络的通信开销。实验结果证明了算法的有效性。 展开更多
关键词 分布式数据库 数据挖掘 关联规则 频繁项集 网络通信开销
下载PDF
基于异集产生频繁项集的研究
20
作者 马猛 倪志伟 《计算机工程与应用》 CSCD 北大核心 2005年第8期173-175,232,共4页
如何从密集数据库中高效挖掘频繁项集一直是数据挖掘领域研究的难点和重点。文章介绍了一种新的数据存储格式—异集。将密集数据库转换为异集数据库,可大幅度降低数据库的规模、挖掘过程产生的中间结果以及CPU计算时间。该文给出了一个... 如何从密集数据库中高效挖掘频繁项集一直是数据挖掘领域研究的难点和重点。文章介绍了一种新的数据存储格式—异集。将密集数据库转换为异集数据库,可大幅度降低数据库的规模、挖掘过程产生的中间结果以及CPU计算时间。该文给出了一个基于异集数据库的频繁项集的挖掘算法,实验表明该算法有效。 展开更多
关键词 异集 关联规则 频繁项集 密集数据库
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部