期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于图的关联规则挖掘高效算法研究 被引量:4
1
作者 刘独玉 杨晋浩 +1 位作者 钟守铭 李正良 《计算机工程与设计》 CSCD 北大核心 2006年第23期4475-4478,4493,共5页
通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较;同时通过设... 通过对文献[1]中介绍的基于图的关联规则挖掘算法的详细分析,提出了一种新的基于完全子图的关联规则挖掘算法。该算法利用完全子图与频繁项集的对应关系,以完全子图结点的度作为判断标准,完全避免了不必比较项目之间的比较;同时通过设置关联图结点的order值,完全避免了相同项目集的重复比较,从而在寻找k-项频繁集(≥3)的过程中,时间复杂度远小于原算法的k-11。因此,该算法减小了存储空间,加快了挖掘速度,提高了算法的效率。 展开更多
关键词 关联规则 数据挖掘 关联图 完全子图 频繁项集
下载PDF
分布式全局频繁项目集的快速挖掘方法 被引量:11
2
作者 宋宝莉 覃征 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第8期923-927,共5页
针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,... 针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,每个节点只保留指向父结点的指针,减少了指针数,由此可节省1/3的树空间;同时通过传送用3个很小的数组表示的被约束子树,在此挖掘全局频繁项目集的过程中不再生成大量候选项目集或条件FP-树,从而减小了网络通信量,提高了挖掘效率.实验表明,所提算法的挖掘速度比传统的分布式数据库数据挖掘算法至少提高了1倍之多,随着数据库规模的增大,它的扩展性将更好. 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 被约束子树
下载PDF
分布式数据库的全局频繁项目集高效更新算法 被引量:1
3
作者 宋宝莉 覃征 《计算机工程与应用》 CSCD 北大核心 2006年第31期157-160,共4页
提出了快速更新全局频繁项目集的算法IUAGFI(IncrementalUpdatingAlgorithmforGlobalFrequentItemsets)。该算法主要考虑数据库记录发生变化时全局频繁项目集的更新情况,在最坏的情况下仅需扫描各局部数据库一遍,并利用已建立的各局部... 提出了快速更新全局频繁项目集的算法IUAGFI(IncrementalUpdatingAlgorithmforGlobalFrequentItemsets)。该算法主要考虑数据库记录发生变化时全局频繁项目集的更新情况,在最坏的情况下仅需扫描各局部数据库一遍,并利用已建立的各局部改进的频繁模式树和已挖掘的结果,可避免传送某些原全局频繁项目对应的被约束子树,从而降低网络通讯代价。实验结果表明,该算法是有效可行的。 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 约束子树 更新
下载PDF
在单向FP-tree上挖掘频繁闭项集 被引量:4
4
作者 王现君 宋晶晶 姜保庆 《计算机工程与应用》 CSCD 北大核心 2008年第10期150-153,237,共5页
频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数... 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。 展开更多
关键词 数据挖掘 频繁项集 频繁闭项集 单向FP-tree 被约束子树
下载PDF
基于图的挖掘关联规则改进算法 被引量:1
5
作者 唐德权 《湖南文理学院学报(自然科学版)》 CAS 2006年第3期72-74,79,共4页
关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,... 关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优. 展开更多
关键词 关联规则挖掘 APRIOR算法 完全子图 频繁项集
下载PDF
基于下钻操作的多层关联规则挖掘算法研究
6
作者 刘德喜 何炎祥 邢显黎 《三峡大学学报(自然科学版)》 CAS 2006年第2期169-173,共5页
多层关联规则涉及多个抽象层中的项,它是通过有概念分层的关联规则挖掘而产生的.传统的方法仅考察每个概念层次内是否有用户感兴趣的规则,而忽略了不同概念之间的规则.另外,很多挖掘出的规则并不是用户感兴趣的.提出的关联规则的下钻操... 多层关联规则涉及多个抽象层中的项,它是通过有概念分层的关联规则挖掘而产生的.传统的方法仅考察每个概念层次内是否有用户感兴趣的规则,而忽略了不同概念之间的规则.另外,很多挖掘出的规则并不是用户感兴趣的.提出的关联规则的下钻操作沿袭了OLAP中下钻的概念,它是通过对已经挖掘得到的用户感兴趣的规则进行再分析,挖掘出用户感兴趣的子关联规则,从而达高效挖掘多层关联规则的目的,且这种规则不局限于同一概念层次内. 展开更多
关键词 多层关联规则 下钻操作 子关联规则 子项集
下载PDF
分布式数据库关联规则更新算法
7
作者 宋宝莉 覃征 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第4期416-420,共5页
提出了一种分布式关联规则增量更新算法(IUAAR),它可对数据库发生变化的情况进行归类.该算法主要采用改进了的FP树结构,通过传送被约束子树来挖掘全局频繁项目集,并充分利用快速分布式挖掘算法建立的各局部FP树,只对新增加了的全局频繁... 提出了一种分布式关联规则增量更新算法(IUAAR),它可对数据库发生变化的情况进行归类.该算法主要采用改进了的FP树结构,通过传送被约束子树来挖掘全局频繁项目集,并充分利用快速分布式挖掘算法建立的各局部FP树,只对新增加了的全局频繁项目修改相应的改进FP树,挖掘其对应的被约束子树,同时利用已挖掘的全局频繁项目集对原全局频繁项目对应的被约束子树进行有效修剪.实验结果表明,该算法的运算速度比快速分布式挖掘算法提高了1倍,在最坏的情况下,对各局部数据库也仅需要扫描一遍,从而可提高数据库的维护效率. 展开更多
关键词 分布式数据库 全局频繁项目集 约束子树 增量更新
下载PDF
基于子规则的关联规则生成算法 被引量:3
8
作者 任小龙 吴耿锋 赵朔 《计算机工程》 CAS CSCD 北大核心 2004年第1期77-79,共3页
关联规则是数据挖掘中重要的课题之一。传统的由频繁项目集产生关联规则的 方法由于要考虑频繁项目集的每一个非空真子集,当频繁项目集的长度较长时代价较大。文 中提出用K项子频繁项目集导出关联规则以后得到的有用信息以指导K+1项父... 关联规则是数据挖掘中重要的课题之一。传统的由频繁项目集产生关联规则的 方法由于要考虑频繁项目集的每一个非空真子集,当频繁项目集的长度较长时代价较大。文 中提出用K项子频繁项目集导出关联规则以后得到的有用信息以指导K+1项父频繁项目集产生 强关联规则,由于利用了前面已有的有用信息,当频繁模式长度很长时,或者可信度较高时 ,效率尤其显著。 展开更多
关键词 频繁项目集 强关联规则 子项目集 父项目集
下载PDF
在单向FP-tree上挖掘最大频繁项集 被引量:1
9
作者 宋晶晶 姜保庆 关丽霞 《现代计算机》 2010年第1期19-24,共6页
针对稠密数据集,提出一种基于单向FP-tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-t... 针对稠密数据集,提出一种基于单向FP-tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算最大频繁项集的弊端,极大的降低了内存空间和时间开销,提高了挖掘效率。实验表明,与FP-Max算法相比,算法的效率提高了1倍以上。 展开更多
关键词 数据挖掘 频繁项集 最大频繁项集 单向FP—tree 被约束子树
下载PDF
基于差分隐私的频繁项集挖掘的启发式算法 被引量:4
10
作者 陈婷婷 龙士工 《计算机工程与设计》 北大核心 2019年第2期412-417,共6页
针对频繁项目集挖掘结果直接发布可能会造成严重的个人隐私泄露,提出一种满足差分隐私的频繁项目集挖掘算法。为降低差分隐私的全局敏感度,根据候选项的覆盖分数和项集与事务距离两个指标,采用启发式截断算法进行事务截断,尽可能多地使... 针对频繁项目集挖掘结果直接发布可能会造成严重的个人隐私泄露,提出一种满足差分隐私的频繁项目集挖掘算法。为降低差分隐私的全局敏感度,根据候选项的覆盖分数和项集与事务距离两个指标,采用启发式截断算法进行事务截断,尽可能多地使截断后的事务保留原事务的频繁项信息。采用最大支持度估计策略生成候选项集,降低因事务截断和剪枝操作带来的误差。实验结果对比分析表明,提出算法满足差分隐私保护,挖掘的频繁项集具有较好的效用。 展开更多
关键词 差分隐私 频繁项目集 启发式截断 覆盖分数 项集与事务距离 最大支持度估计策略
下载PDF
基于单向频繁模式树的频繁项集挖掘算法 被引量:3
11
作者 蒋东洁 李玲娟 《计算机技术与发展》 2019年第10期175-180,共6页
频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针... 频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。 展开更多
关键词 数据挖掘 频繁项集 单向频繁模式树 被约束子树
下载PDF
SUBic:A Scalable Unsupervised Framework for Discovering High Quality Biclusters
12
作者 Jooil Lee Yanhua Jin Won Suk Lee 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第4期636-646,共11页
A biclustering algorithm extends conventional clustering techniques to extract all of the meaningful subgroups of genes and conditions in the expression matrix of a microarray dataset. However, such algorithms are ver... A biclustering algorithm extends conventional clustering techniques to extract all of the meaningful subgroups of genes and conditions in the expression matrix of a microarray dataset. However, such algorithms are very sensitive to input parameters and show poor scalability. This paper proposes a scalable unsupervised biclustering framework, SUBic, to find high quality constant-row biclusters in an expression matrix effectively. A one-dimensional clustering algorithm is proposed to partition the attributes, that is, columns of an expression matrix into disjoint groups based on the similarity of expression values. These groups form a set of short transactions and are used to discover a set of frequent itemsets each of which corresponds to a bicluster. However, a bicluster may include any attribute whose expression value is not similar enough to others, so a bicluster refinement is used to enhance the quality of a bicluster by removing those attributes based on its distribution of expression values. The performance of the proposed method is comparatively analyzed through a series of experiments on synthetic and real datasets. 展开更多
关键词 BICLUSTERING CLUSTERING expression matrix frequent itemset sub-matrix
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部