期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
New algorithm of mining frequent closed itemsets
1
作者 张亮 任永功 付玉 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期335-338,共4页
A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory an... A new algorithm based on an FC-tree (frequent closed pattern tree) and a max-FCIA (maximal frequent closed itemsets algorithm) is presented, which is used to mine the frequent closed itemsets for solving memory and time consuming problems. This algorithm maps the transaction database by using a Hash table,gets the support of all frequent itemsets through operating the Hash table and forms a lexicographic subset tree including the frequent itemsets.Efficient pruning methods are used to get the FC-tree including all the minimum frequent closed itemsets through processing the lexicographic subset tree.Finally,frequent closed itemsets are generated from minimum frequent closed itemsets.The experimental results show that the mapping transaction database is introduced in the algorithm to reduce time consumption and to improve the efficiency of the program.Furthermore,the effective pruning strategy restrains the number of candidates,which saves space.The results show that the algorithm is effective. 展开更多
关键词 frequent itemsets frequent closed itemsets minimum frequent closed itemsets maximal frequent closed itemsets frequent closed pattern tree
下载PDF
CFSBC: Clustering in High-Dimensional Space Based on Closed Frequent Item Set
2
作者 NIWei-wei SUNZhi-hui 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期590-594,共5页
Clustering in high-dimensional space is an important domain in data mining. It is the process of discovering groups in a high-dimensional dataset, in such way, that the similarity between the elements of the same clus... Clustering in high-dimensional space is an important domain in data mining. It is the process of discovering groups in a high-dimensional dataset, in such way, that the similarity between the elements of the same cluster is maximum and between different clusters is minimal. Many clustering algorithms are not applicable to high-dimensional space for its sparseness and decline properties. Dimensionality reduction is an effective method to solve this problem. The paper proposes a novel clustering algorithm CFSBC based on closed frequent itemsets derived from association rule mining, which can get the clustering attributes with high efficiency. The algorithm has several advantages. First, it deals effectively with the problem of dimensionality reduction. Second, it is applicable to different kinds of attributes. Third, it is suitable for very large data sets. Experiment shows that the proposed algorithm is effective and efficient. Key words clustering - closed frequent itemsets - association rule - clustering attributes CLC number TP 311 Foundation item: Supported by the National Natural Science Foundation of China (70371015)Biography: NI Wei-wei (1979-), male, Ph. D candidate, research direction: data mining and knowledge discovery. 展开更多
关键词 CLUSTERING closed frequent itemsets association rule clustering attributes
下载PDF
Mining Frequent Closed Itemsets in Large High Dimensional Data
3
作者 余光柱 曾宪辉 邵世煌 《Journal of Donghua University(English Edition)》 EI CAS 2008年第4期416-424,共9页
Large high-dimensional data have posed great challenges to existing algorithms for frequent itemsets mining.To solve the problem,a hybrid method,consisting of a novel row enumeration algorithm and a column enumeration... Large high-dimensional data have posed great challenges to existing algorithms for frequent itemsets mining.To solve the problem,a hybrid method,consisting of a novel row enumeration algorithm and a column enumeration algorithm,is proposed.The intention of the hybrid method is to decompose the mining task into two subtasks and then choose appropriate algorithms to solve them respectively.The novel algorithm,i.e.,Inter-transaction is based on the characteristic that there are few common items between or among long transactions.In addition,an optimization technique is adopted to improve the performance of the intersection of bit-vectors.Experiments on synthetic data show that our method achieves high performance in large high-dimensional data. 展开更多
关键词 frequent closed Itemsets large highdimensional data row enumeration column enumeration hybrid method
下载PDF
An efficient algorithm for mining closed itemsets 被引量:1
4
作者 刘君强 潘云鹤 《Journal of Zhejiang University Science》 CSCD 2004年第1期8-15,共8页
This paper presents a new efficient algorithm for mining frequent closed itemsets. It enumerates the closed set of frequent itemsets by using a novel compound frequent itemset tree that facilitates fast growth and eff... This paper presents a new efficient algorithm for mining frequent closed itemsets. It enumerates the closed set of frequent itemsets by using a novel compound frequent itemset tree that facilitates fast growth and efficient pruning of search space. It also employs a hybrid approach that adapts search strategies, representations of projected transaction subsets, and projecting methods to the characteristics of the dataset. Efficient local pruning, global subsumption checking, and fast hashing methods are detailed in this paper. The principle that balances the overheads of search space growth and pruning is also discussed. Extensive experimental evaluations on real world and artificial datasets showed that our algorithm outperforms CHARM by a factor of five and is one to three orders of magnitude more efficient than CLOSET and MAFIA. 展开更多
关键词 Knowledge discovery Data mining frequent closed patterns Association rules
下载PDF
Knowledge Acquisition from Forestry Machinery Patent Based on the Algorithm for Closed Weighted Pattern Mining
5
作者 Huiling Yu Jie Guo +2 位作者 Dongyan Shi Guangsheng Chen Shanshan Cui 《国际计算机前沿大会会议论文集》 2015年第1期93-94,共2页
The application of big data mining can create over a trillion dollars value. Patents contain a great deal of new technologies and new methods which have unique value in the product innovation. In order to improve the ... The application of big data mining can create over a trillion dollars value. Patents contain a great deal of new technologies and new methods which have unique value in the product innovation. In order to improve the effectiveness of big data mining and aid the innovation of products of forestry machinery, the algorithm for closed weighted pattern mining is applied to acquire the function knowledge in the patents of forestry machinery. Compared with the other algorithms for mining patterns, the algorithm is more suitable for the characteristics of patent data. It not only takes into account the importance of different items to reduce the search space effectively, but also avoids achieving excessive uninteresting patterns below the premise that assures quality. The extensive performance study shows that the patterns which are mined by the closed weighted pattern algorithm are more representative and the acquired knowledge has more realistic application significance. 展开更多
关键词 FORESTRY MACHINERY PATENT Knowledge acquisition closed frequent PATTERN WEIGHTED frequent PATTERN
下载PDF
一种基于Close模式发现用户频繁访问路径的方法 被引量:2
6
作者 陈敏 苗夺谦 《计算机工程》 CAS CSCD 北大核心 2007年第8期14-16,19,共4页
Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了非常有价值的潜在信息。该文在分析用户访问模式的特点后,提出了Close模式的概念,基于此概念提出了一种挖掘用户频繁访问模式的Close算... Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了非常有价值的潜在信息。该文在分析用户访问模式的特点后,提出了Close模式的概念,基于此概念提出了一种挖掘用户频繁访问模式的Close算法。该算法利用频繁访问模式的封闭特性,挖掘出既是频繁的又是封闭的访问模式,在一定程度上减少了下一阶段“寻找最大频繁访问模式”的工作量。用实际数据对算法的性能进行了验证和分析。 展开更多
关键词 WEB挖掘 频繁访问模式 访问模式的顺序子集 close模式
下载PDF
CLOSET^+:基于CLOSET的改进算法
7
作者 杨敏 朱福喜 +1 位作者 刘小丽 余永宏 《计算机应用研究》 CSCD 北大核心 2006年第11期43-46,共4页
分析了用各种不同的方法挖掘频繁闭合模式的优缺点,以及在什么时候该采取什么样的策略以取得较好的表现。提出了一个CLOSET+算法,该算法不仅综合了其他算法的优点,而且还提出了新的思想和算法。
关键词 关联规则 FP-TREE 频繁闭合项目集
下载PDF
HTCLOSE:快速挖掘微阵列数据集中的频繁闭合模式
8
作者 缪裕青 金波 陈国良 《小型微型计算机系统》 CSCD 北大核心 2008年第2期274-278,共5页
由于微阵列数据集行(样本)少列(基因)多的特征,使得采用传统列枚举方法对其进行频繁闭合模式挖掘较为困难.基于行枚举方法,提出超链接结构HT-struct,并基于该结构提出频繁闭合模式挖掘新算法HTCLOSE.算法采用深度优先搜索策略,结合高效... 由于微阵列数据集行(样本)少列(基因)多的特征,使得采用传统列枚举方法对其进行频繁闭合模式挖掘较为困难.基于行枚举方法,提出超链接结构HT-struct,并基于该结构提出频繁闭合模式挖掘新算法HTCLOSE.算法采用深度优先搜索策略,结合高效的修剪技术和巧妙的链表组织技术,在时间和空间上均得到了优化.实验表明,HTCLOSE算法通常快于行枚举算法CARPENTER. 展开更多
关键词 数据挖掘 关联规则 频繁闭合模式 微阵列数据集 生物信息学
下载PDF
一种改进CLOSET算法
9
作者 吴春旭 陈家耀 刘博文 《中国管理科学》 CSSCI 2008年第S1期108-112,共5页
CLOSET算法是一种挖掘频繁闭项集的有效算法。本文分析了CLOSET算法在闭合性检查以及剪枝效率方面的一些不足,并针对这些问题,引入共生项集的概念,利用共生项集的一些性质,提出了一种基于共生项集的改进算法。
关键词 数据挖掘 频繁闭项集 共生项集
下载PDF
基于FPclose算法挖掘强亲密度关联模式 被引量:1
10
作者 刘川 方思行 《计算机工程与设计》 CSCD 北大核心 2005年第5期1149-1151,1154,共4页
基于FPclose算法提出了一种挖掘强亲密度关联模式的算法。算法引入客观兴趣度度量h-置信度来识别强亲密度关联模式,利用其反单调性质和交叉支持度性质进行剪枝。实验证明,该算法能够高效地挖掘出倾斜数据集中的强亲密度关联模式。
关键词 FPclose算法 h-置信度 频繁闭项集 关联规则 数据挖掘
下载PDF
A novel algorithm for frequent itemset mining in data warehouses 被引量:2
11
作者 徐利军 谢康林 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2006年第2期216-224,共9页
Current technology for frequent itemset mining mostly applies to the data stored in a single transaction database. This paper presents a novel algorithm MultiClose for frequent itemset mining in data warehouses. Multi... Current technology for frequent itemset mining mostly applies to the data stored in a single transaction database. This paper presents a novel algorithm MultiClose for frequent itemset mining in data warehouses. MultiClose respectively computes the results in single dimension tables and merges the results with a very efficient approach. Close itemsets technique is used to improve the performance of the algorithm. The authors propose an efficient implementation for star schemas in which their al- gorithm outperforms state-of-the-art single-table algorithms. 展开更多
关键词 frequent itemset close itemset Star schema Dimension table Fact table
下载PDF
用变异FP-树改进CLOSET算法
12
作者 刘迎意 吴春旭 沈陵峰 《计算机仿真》 CSCD 北大核心 2010年第3期98-101,共4页
频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计... 频繁闭项集提供了频繁项集的一种完整、最小表示,对频繁闭项集的挖掘是近年来数据挖掘领域研究的热点,研究人员从不同角度对算法改进以提高算法的效率。基于频繁项集中共生项集的性质,提出无须进行子集检查的频繁闭项集挖掘方法,并设计一种变异的FP-树结构,利用FP-树结构来存储结点共生项集信息,以改进CLOSET算法,算法无须遍历结果集进行闭合性检查。实验表明,在支持度阈值减小,结果集变大时,改进算法的时间增长率比原有算法小。 展开更多
关键词 数据挖掘 频繁闭项集 算法改进
下载PDF
基于信息熵与闭合频繁序列的密码协议逆向方法
13
作者 梁晨 洪征 +1 位作者 吴礼发 吉庆兵 《计算机科学》 CSCD 北大核心 2024年第3期326-334,共9页
未知密码协议被广泛用于敏感信息的安全传输,对其进行逆向分析对攻防双方都具有重要意义。为从网络流量中推断结构复杂的密码协议格式,提出了一种基于信息熵与闭合频繁序列的密码协议逆向方法。利用字节信息熵划分报文的明文域与密文域... 未知密码协议被广泛用于敏感信息的安全传输,对其进行逆向分析对攻防双方都具有重要意义。为从网络流量中推断结构复杂的密码协议格式,提出了一种基于信息熵与闭合频繁序列的密码协议逆向方法。利用字节信息熵划分报文的明文域与密文域,使用BIDE算法挖掘闭合频繁序列,划分报文的动态域和静态域;设计了一种长度域识别算法,对报文进行字节片切,将片切后的字段值与长度域取值集合进行循环比对,实现了密码协议中多种形式的长度域识别;设计了启发策略,用于对加密套件、加密算法等密码协议特有的关键字段进行语义识别。实验结果表明,该方法可以有效地对密码协议进行域划分,提取密码协议的格式,并且在长度域识别和密码协议特有关键字段的语义识别上优于现有方法。 展开更多
关键词 协议逆向 密码协议 信息熵 闭合频繁序列 网络流量 语义分析
下载PDF
基于邻接比特压缩表的频繁闭项集挖掘算法
14
作者 杨博超 吴美璇 +1 位作者 胡浩 朱敏 《计算机仿真》 2024年第1期415-424,共10页
频繁闭项集(Frequent Closed Items,FCI)是一种表示事物之间关联关系的有效方式,它能克服频繁项集(Frequent Items,FI)信息冗余的缺点。FCI挖掘算法研究旨在以更优的时空效率,在原始数据集中找到所有的FCI。相关研究成果重在关注时间效... 频繁闭项集(Frequent Closed Items,FCI)是一种表示事物之间关联关系的有效方式,它能克服频繁项集(Frequent Items,FI)信息冗余的缺点。FCI挖掘算法研究旨在以更优的时空效率,在原始数据集中找到所有的FCI。相关研究成果重在关注时间效率的提升,但空间效率欠佳。提出一种高空间压缩率数据结构——邻接比特压缩表(Compressed Adjacency Byte table,Cab-table),将项集与交易集压缩到剔除全部0之后的比特表中,使空间高度压缩。基于此数据结构的频繁闭项集挖掘算法(Cab-Miner),采用运算栈与检索栈来实现非递归方式的频繁闭项集挖掘,相较于之前普遍采用递归方式的算法,在理论上可使空间占用率由O(L*N+M)降为O(3N)。基于公开数据集与真实数据集的实验表明,上述算法在原始数据集压缩,以及运算内存消耗上,都有较优的表现,尤其在处理真实数据集时,空间表现极佳。另外在某些属性的数据集上也表现出优越的时间效率。 展开更多
关键词 频繁闭项集 邻接比特压缩表 非递归算法 高空间效率
下载PDF
基于闭合频繁模式的半随机森林数据流分类算法
15
作者 孙艳歌 邵罕 蒋明毅 《信阳师范学院学报(自然科学版)》 CAS 2024年第4期442-448,共7页
提出了一种基于闭合频繁模式的半随机森林数据流分类算法(Semi-Random Forest based on Closed Frequent Pattern,SRFCFP),以解决数据流中噪声和概念漂移问题。SRFCFP利用闭合频繁模式对数据流进行表示,去除冗余信息和噪声,突出数据特... 提出了一种基于闭合频繁模式的半随机森林数据流分类算法(Semi-Random Forest based on Closed Frequent Pattern,SRFCFP),以解决数据流中噪声和概念漂移问题。SRFCFP利用闭合频繁模式对数据流进行表示,去除冗余信息和噪声,突出数据特征。采用半随机森林建立分类模型,并通过基于时间衰减的模式集更新机制适应数据流的无限性。为了检测概念漂移并及时适应,引入了一种模式集差异性度量方式,用于测量数据分布变化。实验结果表明,在MOA平台下使用真实和合成数据集,SRFCFP在平均精度上超越了相关对比算法,并能有效处理数据流中的概念漂移和噪声问题。 展开更多
关键词 数据流 闭合频繁模式 半随机森林 概念漂移 噪声
下载PDF
Efficient Mining of Frequent Closed XML Query Pattern
16
作者 冯建华 钱乾 +1 位作者 王建勇 周立柱 《Journal of Computer Science & Technology》 SCIE EI CSCD 2007年第5期725-735,共11页
Previous research works have presented convincing arguments that a frequent pattern mining algorithm should not mine all frequent but only the closed ones because the latter leads to not only more compact yet complete... Previous research works have presented convincing arguments that a frequent pattern mining algorithm should not mine all frequent but only the closed ones because the latter leads to not only more compact yet complete result set but also better efficiency. Upon discovery of frequent closed XML query patterns, indexing and caching can be effectively adopted for query performance enhancement. Most of the previous algorithms for finding frequent patterns basically introduced a straightforward generate-and-test strategy. In this paper, we present SOLARIA*, an efficient algorithm for mining frequent closed XML query patterns without candidate maintenance and costly tree-containment checking. Efficient algorithm of sequence mining is involved in discovering frequent tree-structured patterns, which aims at replacing expensive containment testing with cheap parent-child checking in sequences. SOLARIA* deeply prunes unrelated search space for frequent pattern enumeration by parent-child relationship constraint. By a thorough experimental study on various real-life data, we demonstrate the efficiency and scalability of SOLARIA* over the previous known alternative. SOLARIA* is also linearly scalable in terms of XML queries' size. 展开更多
关键词 computer software frequent closed pattern data mining XML XPATH
原文传递
基于滑动窗口的数据流闭合频繁模式的挖掘 被引量:26
17
作者 刘学军 徐宏炳 +2 位作者 董逸生 钱江波 王永利 《计算机研究与发展》 EI CSCD 北大核心 2006年第10期1738-1743,共6页
频繁闭合模式集惟一确定频繁模式完全集并且数量小得多,然而,如何挖掘滑动窗口中的频繁闭合模式集是一个很大的挑战.根据数据流的特点,提出了一种发现滑动窗口中频繁闭合模式的新方法DSCFI.DSCFI算法将滑动窗口分割为若干个基本窗口,以... 频繁闭合模式集惟一确定频繁模式完全集并且数量小得多,然而,如何挖掘滑动窗口中的频繁闭合模式集是一个很大的挑战.根据数据流的特点,提出了一种发现滑动窗口中频繁闭合模式的新方法DSCFI.DSCFI算法将滑动窗口分割为若干个基本窗口,以基本窗口为更新单位,利用已有的频繁闭合模式挖掘算法计算每个基本窗口的潜在频繁闭合项集,将它们及其子集存储到一种新的数据结构DSCFItree中,DSCFItree能够增量更新,利用DSCFItree可以快速地挖掘滑动窗口中的所有频繁闭合模式.最后,通过实验验证了这种方法的有效性. 展开更多
关键词 数据流 闭合频繁项集 滑动窗口 关联规则 知识发现
下载PDF
数据流中频繁闭项集的近似挖掘算法 被引量:14
18
作者 刘旭 毛国君 +1 位作者 孙岳 刘椿年 《电子学报》 EI CAS CSCD 北大核心 2007年第5期900-905,共6页
在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘... 在数据流中挖掘频繁项集得到了广泛的研究,传统的研究方法大多关注于在数据流中挖掘全部频繁项集.由于挖掘全部频繁项集存在数据和模式冗余问题,所以对算法的时间和空间效率都具有更大的挑战性.因此,近年来人们开始关注在数据流中挖掘频繁闭项集,其中一个典型的工作就是Moment算法.本文提出了一种数据流中频繁闭项集的近似挖掘算法A-Moment.它采用衰减窗口机制、近似计数估计方法和分布式更新信息策略来解决Moment算法中过度依赖于窗口和执行效率低等问题.实验表明,该算法在保证挖掘精度的前提下,可以比Moment获得更好的效率. 展开更多
关键词 数据挖掘 数据流 频繁闭项集
下载PDF
频繁闭项目集挖掘算法研究 被引量:10
19
作者 朱玉全 宋余庆 《计算机研究与发展》 EI CSCD 北大核心 2007年第7期1177-1183,共7页
目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出... 目前已提出了许多基于Apriori算法思想的频繁项目集挖掘算法,这些算法可以有效地挖掘出事务数据库中的短频繁项目集,但对于长频繁项目集的挖掘而言,其性能将明显下降.为此,提出了一种频繁闭项目集挖掘算法MFCIA,该算法可以有效地挖掘出事务数据库中所有的频繁项目集,并对其更新问题进行了研究,提出了一种相应的频繁闭项目集增量式更新算法UMFCIA,该算法将充分利用先前的挖掘结果来节省发现新的频繁闭项目集的时间开销.实验结果表明算法MFCIA是有效可行的. 展开更多
关键词 频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 增量式更新
下载PDF
基于频繁闭项集的新关联分类算法ACCF 被引量:14
20
作者 李学明 杨阳 +1 位作者 秦东霞 周尚波 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第1期104-109,共6页
提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过... 提出了基于频繁闭项集的新关联分类算法ACCF。ACCF首先挖掘出所有频繁闭项集(CFIs)和候选分类关联规则,然后从候选分类关联规则中产生和筛选出若干规则,并用其构建分类器;在分类应用时,采用了一种新的匹配方式对分类实例进行分类。通过理论分析和对18个UCI公共数据集的实验结果表明,ACCF不仅能挖掘出高质量且不丢失信息的关联分类规则,而且大大减少了关联分类规则的数量,在分类准确率上也比现有的关联分类典型算法更高。 展开更多
关键词 关联分类 类关联规则 频繁闭项集 数据挖掘
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部