期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
快速关联规则挖掘算法 被引量:15
1
作者 杜孝平 马秀莉 +1 位作者 唐世渭 牧之内 显文 《计算机工程与应用》 CSCD 北大核心 2002年第11期1-4,47,共5页
关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度... 关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。 展开更多
关键词 频繁项集 关联规则 算法 数据挖掘 数据库 知识发现
下载PDF
基于COFI-Tree的N-最有兴趣项目集挖掘算法 被引量:4
2
作者 肖继海 崔晓红 陈俊杰 《计算机技术与发展》 2012年第3期99-102,共4页
BOMO算法采用递归构造条件子树,在挖掘大数据集时耗时较长,执行效率低,为了解决这一不足,文中给出一种基于COFI-Tree的挖掘N-最有兴趣项目集算法。算法采用COFI-Tree结构,无需递归构造条件子树FP-Tree,在同一时间内只有一个COFI-Tree在... BOMO算法采用递归构造条件子树,在挖掘大数据集时耗时较长,执行效率低,为了解决这一不足,文中给出一种基于COFI-Tree的挖掘N-最有兴趣项目集算法。算法采用COFI-Tree结构,无需递归构造条件子树FP-Tree,在同一时间内只有一个COFI-Tree在内存,并且有效地减少了其运算时间。通过对两种算法进行对比分析,实验结果得出:该算法比BOMO算法程序执行时间明显缩短;在挖掘大数据集时执行效率显著提高,尤其是k<4时,性能最好。由此可见,改进后的算法是可行有效的。 展开更多
关键词 数据挖掘 关联规则 N-最有兴趣项目集 FP-TREE COFI-Tree
下载PDF
一种改进的基于N-List的频繁项集挖掘算法 被引量:6
3
作者 翟悦 王璨 孙建言 《计算机应用与软件》 北大核心 2018年第9期67-72,共6页
针对在海量数据中频繁项集挖掘耗时问题,近年来提出的N-List结构可有效提高挖掘效率。基于N-List提出一种新的频繁项集挖掘算法HNSFI(Hash table and subsume frequent itemsets mining based on N-List)。该算法利用PPC-tree生成N-List... 针对在海量数据中频繁项集挖掘耗时问题,近年来提出的N-List结构可有效提高挖掘效率。基于N-List提出一种新的频繁项集挖掘算法HNSFI(Hash table and subsume frequent itemsets mining based on N-List)。该算法利用PPC-tree生成N-List,引入哈希表存储N-List表示的项集,加快N-List相交操作运算时间;引入包含因子概念,利用其性质通过组合方法可以直接生成部分频繁项集,进一步提高算法时间性能。在三种不同的数据集上对该算法进行了测试和分析,实验结果表明在稠密数据集中该算法的时间性能是最优的。 展开更多
关键词 频繁项集挖掘 包含因子 哈希存储 N—List
下载PDF
客观世界的n元关系——兼谈传统形式逻辑和数理逻辑
4
作者 龚启荣 《重庆理工大学学报(社会科学)》 CAS 2012年第4期16-24,共9页
当代形式逻辑对客观世界n元关系的研究,其视野是传统形式逻辑和数理逻辑无法相比的。从主导思想上看,传统形式逻辑是真正的名副其实的逻辑科学,但它只研究1元关系,不研究多元关系和真正普遍有效的关系推理,因此,传统形式逻辑顶多只能算... 当代形式逻辑对客观世界n元关系的研究,其视野是传统形式逻辑和数理逻辑无法相比的。从主导思想上看,传统形式逻辑是真正的名副其实的逻辑科学,但它只研究1元关系,不研究多元关系和真正普遍有效的关系推理,因此,传统形式逻辑顶多只能算n分之1的逻辑。数理逻辑虽然把1元或多元关系作为自己的研究对象之一,但它没有从内涵的角度去区分关于同一外延的k个尽管相当然而并不相同的n元关系,从量上说至少是"挂1漏k-1"的,即只从外延的角度研究一种关系而漏掉(k-1)种关系,因此,纯外延的数理逻辑顶多只能算k分之1的逻辑。当代形式逻辑从研究论域上的n目组和n目组集入手,亦即通过确定论域上的个体的所有不同序列,对论域上n个个体(n≥1)之间的所有关系进行了逻辑科学应有的全方位研究。 展开更多
关键词 当代形式逻辑 传统形式逻辑 数理逻辑 n目组 n目组集 n元关系
下载PDF
NB-MAFIA:基于N-List的最长频繁项集挖掘算法 被引量:5
5
作者 沈戈晖 刘沛东 邓志鸿 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第2期199-209,共11页
本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集... 本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上,通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法,尤其在真实和稠密数据集上优势更为明显。 展开更多
关键词 数据挖掘 频繁项集挖掘 最长项集 N-List 算法
下载PDF
N个最频繁项集挖掘算法 被引量:6
6
作者 陈晓云 胡运发 《模式识别与人工智能》 EI CSCD 北大核心 2007年第4期512-518,共7页
频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于... 频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义 N 个最频繁项集挖掘问题,并提出基于支持度阈值动态调整策略的宽度优先搜索算法 NApriori 和深度优先搜索算法IntvMatrix 挖掘 N 个最频繁项集.实验表明,本文的2种方法的效率比朴素方法高2倍以上,特别当 N 值较低时,本文方法的效率优势更为明显. 展开更多
关键词 数据挖掘 N个最频繁项集 支持度阈值 倒排矩阵
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部