期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
New algorithm of mining frequent closed itemsets
1
作者 张亮 任永功 付玉 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期335-338,共4页
A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory an... A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory and time consuming problems. This algorithm maps the transaction database by using a Hash table,gets the support of all frequent itemsets through operating the Hash table and forms a lexicographic subset tree including the frequent itemsets.Efficient pruning methods are used to get the FC-tree including all the minimum frequent closed itemsets through processing the lexicographic subset tree.Finally,frequent closed itemsets are generated from minimum frequent closed itemsets.The experimental results show that the mapping transaction database is introduced in the algorithm to reduce time consumption and to improve the efficiency of the program.Furthermore,the effective pruning strategy restrains the number of candidates,which saves space.The results show that the algorithm is effective. 展开更多
关键词 frequent itemsets frequent closed itemsets minimum frequent closed itemsets maximal frequent closed itemsets frequent closed pattern tree
下载PDF
Mining Frequent Closed Itemsets in Large High Dimensional Data
2
作者 余光柱 曾宪辉 邵世煌 《Journal of Donghua University(English Edition)》 EI CAS 2008年第4期416-424,共9页
Large high-dimensional data have posed great challenges to existing algorithms for frequent itemsets mining.To solve the problem,a hybrid method,consisting of a novel row enumeration algorithm and a column enumeration... Large high-dimensional data have posed great challenges to existing algorithms for frequent itemsets mining.To solve the problem,a hybrid method,consisting of a novel row enumeration algorithm and a column enumeration algorithm,is proposed.The intention of the hybrid method is to decompose the mining task into two subtasks and then choose appropriate algorithms to solve them respectively.The novel algorithm,i.e.,Inter-transaction is based on the characteristic that there are few common items between or among long transactions.In addition,an optimization technique is adopted to improve the performance of the intersection of bit-vectors.Experiments on synthetic data show that our method achieves high performance in large high-dimensional data. 展开更多
关键词 frequent closed itemsets large highdimensional data row enumeration column enumeration hybrid method
下载PDF
CFSBC: Clustering in High-Dimensional Space Based on Closed Frequent Item Set
3
作者 NIWei-wei SUNZhi-hui 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期590-594,共5页
Clustering in high-dimensional space is an important domain in data mining. It is the process of discovering groups in a high-dimensional dataset, in such way, that the similarity between the elements of the same clus... Clustering in high-dimensional space is an important domain in data mining. It is the process of discovering groups in a high-dimensional dataset, in such way, that the similarity between the elements of the same cluster is maximum and between different clusters is minimal. Many clustering algorithms are not applicable to high-dimensional space for its sparseness and decline properties. Dimensionality reduction is an effective method to solve this problem. The paper proposes a novel clustering algorithm CFSBC based on closed frequent itemsets derived from association rule mining, which can get the clustering attributes with high efficiency. The algorithm has several advantages. First, it deals effectively with the problem of dimensionality reduction. Second, it is applicable to different kinds of attributes. Third, it is suitable for very large data sets. Experiment shows that the proposed algorithm is effective and efficient. Key words clustering - closed frequent itemsets - association rule - clustering attributes CLC number TP 311 Foundation item: Supported by the National Natural Science Foundation of China (70371015)Biography: NI Wei-wei (1979-), male, Ph. D candidate, research direction: data mining and knowledge discovery. 展开更多
关键词 CLUSTERING closed frequent itemsets association rule clustering attributes
下载PDF
A novel algorithm for frequent itemset mining in data warehouses 被引量:2
4
作者 徐利军 谢康林 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2006年第2期216-224,共9页
Current technology for frequent itemset mining mostly applies to the data stored in a single transaction database. This paper presents a novel algorithm MultiClose for frequent itemset mining in data warehouses. Multi... Current technology for frequent itemset mining mostly applies to the data stored in a single transaction database. This paper presents a novel algorithm MultiClose for frequent itemset mining in data warehouses. MultiClose respectively computes the results in single dimension tables and merges the results with a very efficient approach. Close itemsets technique is used to improve the performance of the algorithm. The authors propose an efficient implementation for star schemas in which their al- gorithm outperforms state-of-the-art single-table algorithms. 展开更多
关键词 frequent itemset close itemset Star schema Dimension table Fact table
下载PDF
CLOSET^+:基于CLOSET的改进算法
5
作者 杨敏 朱福喜 +1 位作者 刘小丽 余永宏 《计算机应用研究》 CSCD 北大核心 2006年第11期43-46,共4页
分析了用各种不同的方法挖掘频繁闭合模式的优缺点,以及在什么时候该采取什么样的策略以取得较好的表现。提出了一个CLOSET+算法,该算法不仅综合了其他算法的优点,而且还提出了新的思想和算法。
关键词 关联规则 FP-TREE 频繁闭合项目集
下载PDF
一种改进CLOSET算法
6
作者 吴春旭 陈家耀 刘博文 《中国管理科学》 CSSCI 2008年第S1期108-112,共5页
CLOSET算法是一种挖掘频繁闭项集的有效算法。本文分析了CLOSET算法在闭合性检查以及剪枝效率方面的一些不足,并针对这些问题,引入共生项集的概念,利用共生项集的一些性质,提出了一种基于共生项集的改进算法。
关键词 数据挖掘 频繁闭项集 共生项集
下载PDF
基于FPclose算法挖掘强亲密度关联模式 被引量:1
7
作者 刘川 方思行 《计算机工程与设计》 CSCD 北大核心 2005年第5期1149-1151,1154,共4页
基于FPclose算法提出了一种挖掘强亲密度关联模式的算法。算法引入客观兴趣度度量h-置信度来识别强亲密度关联模式,利用其反单调性质和交叉支持度性质进行剪枝。实验证明,该算法能够高效地挖掘出倾斜数据集中的强亲密度关联模式。
关键词 FPclose算法 h-置信度 频繁闭项集 关联规则 数据挖掘
下载PDF
一种基于ZBDD结构的Top-k挖掘算法
8
作者 焦雷 《现代计算机》 2011年第20期3-7,共5页
研究微阵列数据中挖掘Top-k频繁闭合项集问题,并设计挖掘算法ZDtop。算法采用ZBDD结构压缩存储数据集,使用自顶向下深度优先搜索策略挖掘项集长度不小于给定值min_l的Top-k频繁闭合项集,并对搜索空间进行有效修剪。通过实例证明该算法... 研究微阵列数据中挖掘Top-k频繁闭合项集问题,并设计挖掘算法ZDtop。算法采用ZBDD结构压缩存储数据集,使用自顶向下深度优先搜索策略挖掘项集长度不小于给定值min_l的Top-k频繁闭合项集,并对搜索空间进行有效修剪。通过实例证明该算法是正确有效的。 展开更多
关键词 微阵列数据 Top—k频繁闭合项集 ZBDD 深度优先
下载PDF
数据流中频繁闭项集的近似挖掘算法 被引量:14
9
作者 刘旭 毛国君 +1 位作者 孙岳 刘椿年 《电子学报》 EI CAS CSCD 北大核心 2007年第5期900-905,共6页
在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘... 在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率. 展开更多
关键词 数据挖掘 数据流 频繁闭项集
下载PDF
基于频繁闭项集的新关联分类算法ACCF 被引量:14
10
作者 李学明 杨阳 +1 位作者 秦东霞 周尚波 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第1期104-109,共6页
提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过... 提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过理论分析和对18个UCI公共数据集的实验结果表明,ACCF不仅能挖掘出高质量且不丢失信息的关联分类规则,而且大大减少了关联分类规则的数量,在分类准确率上也比现有的关联分类典型算法更高。 展开更多
关键词 关联分类 类关联规则 频繁闭项集 数据挖掘
下载PDF
一种改进的频繁闭项集挖掘算法 被引量:11
11
作者 宋威 杨炳儒 +1 位作者 徐章艳 高静 《计算机研究与发展》 EI CSCD 北大核心 2008年第2期278-286,共9页
频繁闭项集惟一确定频繁项集且规模小得多,但挖掘频繁闭项集仍是很费时的.为提高挖掘效率,提出了一种改进的频繁闭项集挖掘算法DCI-Closed-Index.该算法用"索引数组"来组织数据,通过为每个项目增加包含索引,找到频繁共同出现... 频繁闭项集惟一确定频繁项集且规模小得多,但挖掘频繁闭项集仍是很费时的.为提高挖掘效率,提出了一种改进的频繁闭项集挖掘算法DCI-Closed-Index.该算法用"索引数组"来组织数据,通过为每个项目增加包含索引,找到频繁共同出现的项集.利用二进制位图技术,给出了一个求包含索引的快速算法.然后根据项目在包含索引中出现的频率由高到低进行排序,并利用包含索引作为启发信息,合并同时出现且支持度相等的频繁项,得到初始生成子,从而大大缩小了搜索空间.同时利用索引数组对每一个生成子的前序集和后序集进行约简,得到新的、较小的约简前序集和约简后序集.并证明了约简前序集和后序集与原来的前序集和后序集的功能是一样的.从而减少了候选生成子的集合包含判断的操作.实验结果表明,该算法的性能优于其他主流算法. 展开更多
关键词 数据挖掘 关联规则 频繁闭项集 索引数组 生成子 包含索引
下载PDF
频繁闭项目集挖掘算法研究 被引量:10
12
作者 朱玉全 宋余庆 《计算机研究与发展》 EI CSCD 北大核心 2007年第7期1177-1183,共7页
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出... 目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的. 展开更多
关键词 频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 增量式更新
下载PDF
一种分布式全局频繁闭项目集快速挖掘更新算法 被引量:3
13
作者 陈健美 朱玉全 +3 位作者 倪巍伟 宋余庆 宋顺林 桂长青 《小型微型计算机系统》 CSCD 北大核心 2008年第7期1237-1240,共4页
在数据挖掘研究中,频繁闭项目集挖掘成为重要的研究方向.目前已有的频繁闭项目集挖掘算法主要针对单机环境,有关分布式环境下的全局频繁闭项目集挖掘算法的研究尚不多见.针对无共享体系结构数据水平分布的情况,提出了一种分布式快速挖... 在数据挖掘研究中,频繁闭项目集挖掘成为重要的研究方向.目前已有的频繁闭项目集挖掘算法主要针对单机环境,有关分布式环境下的全局频繁闭项目集挖掘算法的研究尚不多见.针对无共享体系结构数据水平分布的情况,提出了一种分布式快速挖掘全局频繁闭项目集增量式更新算法,算法通过对各节点候选频繁项目集进行预处理,有效地降低网络通信量,提高全局频繁闭项目集挖掘算法的效率,该算法充分利用前次挖掘结果来发现新的全局频繁闭项目集,具有较高的效率.理论分析和实验结果表明算法是有效的. 展开更多
关键词 数据挖掘 分布式数据库 频繁闭项目集 全局频繁闭项目集 增量式更新
下载PDF
基于频繁概念直乘分布的全局闭频繁项集挖掘算法 被引量:19
14
作者 柴玉梅 张卓 王黎明 《计算机学报》 EI CSCD 北大核心 2012年第5期990-1001,共12页
基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成... 基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析了Iceberg概念格并置集成的内在并行特性;以频繁概念直乘及其下覆盖为最小粒度,对Iceberg概念格并置集成过程进行分解和分布式计算;在对其正确性理论证明的基础上,提出了一个新颖的异构分布式环境下闭频繁项集全局挖掘算法.此算法利用Iceberg概念格的半格以及可并置集成特性,充分发挥了分布式环境下计算资源的优势.实验证明,在稠密数据集和稀疏数据集上,该挖掘算法都表现出较好的性能. 展开更多
关键词 Iceberg概念格 分布式数据挖掘 并置集成 异构数据库 闭频繁项集
下载PDF
改进的数据流频繁闭项集挖掘算法 被引量:5
15
作者 刘洁 杨路明 +2 位作者 毛伊敏 刘立新 谢东 《计算机工程》 CAS CSCD 北大核心 2011年第9期75-77,共3页
为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMom... 为提高数据流频繁闭项集的查找效率,提出一种改进的NewMoment频繁闭项集挖掘算法,通过在LevelCET数据结构中加入层次结点,并利用层次检测策略与最佳频繁闭项集检测策略快速挖掘数据流滑动窗口中所有的频繁闭项集。实验结果证明,与NewMoment算法相比,改进的算法性能更优。 展开更多
关键词 数据流 频繁闭项集 滑动窗口 NewMoment算法 LevelCET数据结构
下载PDF
基于图的频繁闭项集挖掘算法 被引量:7
16
作者 李力 翟东海 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2004年第3期385-389,共5页
为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph basedfrequentcloseditemsetgeneration).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库... 为了提高数据挖掘效率,提出了一种基于图的频繁闭项集挖掘算法GFCG(graph basedfrequentcloseditemsetgeneration).该算法采用位矢量技术构造有向图,表示项与项之间的频繁关系,并在有向图的基础上递归产生频繁闭项集,从而只需扫描数据库2次,不产生候选集;引入扩展频繁项集的概念,大大减小了检查频繁项集是否闭的搜索空间.用1个真实数据库和2个合成数据库对GFCG进行了测试,并与A close和CLOSET算法的结果进行了比较,结果表明,该算法具有良好的速度和可伸缩性性能. 展开更多
关键词 数据库 数据挖掘 频繁闭集 位向量
下载PDF
基于频繁项集挖掘最大频繁项集和频繁闭项集 被引量:4
17
作者 姜晗 贾泂 徐峰 《计算机工程与应用》 CSCD 北大核心 2008年第28期146-148,共3页
提出了基于频繁项集的最大频繁项集(BFI-DMFI)和频繁闭项集挖掘算法(BFI-DCFI)。BFI-DMFI算法通过逐个检测频繁项集在其集合中是否存在超集确定该项集是不是最大频繁项集;BFI-DCFI算法则是通过挖掘所有支持度相等的频繁项集中的最大频... 提出了基于频繁项集的最大频繁项集(BFI-DMFI)和频繁闭项集挖掘算法(BFI-DCFI)。BFI-DMFI算法通过逐个检测频繁项集在其集合中是否存在超集确定该项集是不是最大频繁项集;BFI-DCFI算法则是通过挖掘所有支持度相等的频繁项集中的最大频繁项集组合生成频繁闭项集。该类算法的提出,为关联规则的精简提供了一种新的解决方法。 展开更多
关键词 最大频繁项集 频繁闭项集 频繁项集 关联规则
下载PDF
一种基于后缀项表的并行闭频繁项集挖掘算法 被引量:11
18
作者 唐颖峰 陈世平 《计算机应用研究》 CSCD 北大核心 2014年第2期373-377,共5页
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时... 对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以闭频繁项集挖掘的形式,减少组分间的数据传送量,提高挖掘效率。实验表明,该算法可以有效缩短平均挖掘时间,对于高维大数据具有较好的性能。 展开更多
关键词 频繁项集挖掘 并行挖掘算法 MAPREDUCE 闭频繁项集 后缀项表
下载PDF
一种基于位运算的频繁闭项集挖掘算法 被引量:3
19
作者 徐嘉莉 杨洪军 +1 位作者 赵茂娟 樊云 《计算机应用研究》 CSCD 北大核心 2013年第11期3280-3282,3286,共4页
针对相关算法在挖掘频繁闭项集时所存在的问题,提出了一种基于位运算的频繁闭项集挖掘算法。该算法首先将数据集转换成布尔矩阵,只需扫描数据集一次;通过位运算计算支持度,利用矩阵和数组存储辅助信息,减少时间和空间消耗;深度优先搜索... 针对相关算法在挖掘频繁闭项集时所存在的问题,提出了一种基于位运算的频繁闭项集挖掘算法。该算法首先将数据集转换成布尔矩阵,只需扫描数据集一次;通过位运算计算支持度,利用矩阵和数组存储辅助信息,减少时间和空间消耗;深度优先搜索产生频繁闭项集时利用剪枝策略进一步减少挖掘时间;利用同生项集性质进行闭合性检测,无须检查超集或子集。理论分析和实验结果验证了该算法的有效性。 展开更多
关键词 数据挖掘 频繁闭项集 矩阵 位运算 同生项集
下载PDF
在单向FP-tree上挖掘频繁闭项集 被引量:4
20
作者 王现君 宋晶晶 姜保庆 《计算机工程与应用》 CSCD 北大核心 2008年第10期150-153,237,共5页
频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数... 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。 展开更多
关键词 数据挖掘 频繁项集 频繁闭项集 单向FP-tree 被约束子树
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部