期刊文献+
共找到130篇文章
< 1 2 7 >
每页显示 20 50 100
基于频繁模式矩阵的最大频繁项目集挖掘算法 被引量:7
1
作者 李忠哗 吴聪聪 +1 位作者 戴维迪 何丕廉 《计算机应用与软件》 CSCD 北大核心 2007年第7期45-46,53,共3页
提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法。算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘。②在FP-array中只存放... 提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法。算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘。②在FP-array中只存放逻辑型数据,节省了存储空间。③直接在FP-array上挖掘而不需要递归创建大量条件模式矩阵,挖掘过程采用逻辑运算,在效率上有独特的优势。通过实验验证了算法的有效性。 展开更多
关键词 数据挖掘 频繁模式矩阵 最大频繁项目 算法
下载PDF
一种不确定数据集上频繁模式挖掘的近似算法 被引量:8
2
作者 王水 祝孔涛 王乐 《计算机应用研究》 CSCD 北大核心 2014年第3期725-728,共4页
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集... 为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。 展开更多
关键词 数据挖掘 频繁模式 频繁 不确定数据 近似算法
下载PDF
并行挖掘频繁项目集新算法——MREclat 被引量:4
3
作者 章志刚 吉根林 唐梦梦 《计算机应用》 CSCD 北大核心 2014年第8期2175-2178,共4页
针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节... 针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。 展开更多
关键词 频繁项目 并行挖掘算法 列存储 MAP REDUCE Eclat算法
下载PDF
关联规则挖掘中最大频繁集的双向查找算法 被引量:5
4
作者 宋雨 赵建利 王保义 《华北电力大学学报(自然科学版)》 CAS 北大核心 2005年第2期67-70,共4页
在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快... 在事务数据库中挖掘关联规则已成为数据挖掘领域的一个重要研究课题,而其中频繁项集的查找时间是影响挖掘效率的关键因素。基于Apriori算法,根据最大频繁集的双向查找算法,提出了算法的实现步骤,让两个方向的剪枝工作实现信息共享,加快最大频繁集的查找速度,节省I/O操作时间,并且通过实例和仿真实验验证了算法的高效性。 展开更多
关键词 事务数据库 关联规则 数据挖掘 最大频繁 双向查找算法
下载PDF
基于频繁链表的频繁集的挖掘算法 被引量:5
5
作者 袁鼎荣 张师超 《计算机科学》 CSCD 北大核心 2003年第7期165-166,共2页
The problem of mining frequent set is a key issue in data mining. In this paper, a new method of miningfrequent set based on the frequent link is proposed. The algorithm constructs alternate frequent link from the tra... The problem of mining frequent set is a key issue in data mining. In this paper, a new method of miningfrequent set based on the frequent link is proposed. The algorithm constructs alternate frequent link from the transac-tion, the alternate link is yielded by adding up the alternate frequent link which constructed by scanning the transac-tion database in proper order. The frequent link that comprises all the information is constructed with the frequentnode which is selected according requirement. Our algorithm need to scan the transaction database only once and easysupervises the change of frequent set in order to guarantee the right of association rule. 展开更多
关键词 数据库 频繁 数据挖掘算法 频繁链表 事物数据库 FL-Generation算法
下载PDF
频繁模式集挖掘算法TFPDM的研究
6
作者 林红飞 庄卫华 《计算机工程与应用》 CSCD 北大核心 2006年第32期160-163,共4页
受经典的Apriori算法思想和FP-Growth算法思想的启发,在结合两者优点的基础上提出了一种新的算法思想,它是对传统的FP-Growth算法的变形。该算法只需对数据库扫描一次,可以同时对全局和局部频繁模式集进行挖掘,减少了对发生增益数据库... 受经典的Apriori算法思想和FP-Growth算法思想的启发,在结合两者优点的基础上提出了一种新的算法思想,它是对传统的FP-Growth算法的变形。该算法只需对数据库扫描一次,可以同时对全局和局部频繁模式集进行挖掘,减少了对发生增益数据库挖掘的费用。理论分析表明算法是有效的、可行的。 展开更多
关键词 全局和局部频繁模式 变形的频繁集挖掘算法 FP-GROWTH算法 APRIORI算法
下载PDF
一个不需要产生候选集频繁集挖掘算法的研究 被引量:3
7
作者 张勇 杨玲 《吉林农业大学学报》 CAS CSCD 北大核心 2003年第3期346-349,共4页
FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比,FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori... FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比,FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori在性能上作了分析对比。 展开更多
关键词 候选 频繁 数据库 数据挖掘 关联规则 FP-GROWTH算法 APRIORI算法
下载PDF
频繁项目集及相关事务集的挖掘算法 被引量:1
8
作者 陈嶷瑛 武强 李文斌 《计算机工程与应用》 CSCD 北大核心 2006年第15期176-178,共3页
发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该... 发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该算法具有仅需扫描一次事务数据库的特点。另外,还定义了“分散度”指标,用于指导“真频繁项目集”的挖掘。 展开更多
关键词 频繁项目 关联规则 事务树 挖掘算法
下载PDF
基于0-1矩阵的频繁项集挖掘算法研究 被引量:8
9
作者 张月琴 《计算机工程与设计》 CSCD 北大核心 2009年第20期4662-4664,4667,共4页
通过对关联规则挖掘技术及经典算法Apriori的研究和分析,结合该算法存在的问题,提出了一种基于0-1矩阵的频繁集挖掘算法。该算法使扫描数据库的次数减为一次,有效率地降低I/O的存取时间,直接通过支持矩阵行向量的按位与运算来找出频繁集... 通过对关联规则挖掘技术及经典算法Apriori的研究和分析,结合该算法存在的问题,提出了一种基于0-1矩阵的频繁集挖掘算法。该算法使扫描数据库的次数减为一次,有效率地降低I/O的存取时间,直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法中的自联接和减枝,提高了系统的运行效率。通过不断压缩支持矩阵,不仅减少了高次频繁集挖掘的时间,而且节约了存储空间。仿真实验表明,该算法是有效的。 展开更多
关键词 数据挖掘 关联规则 频繁挖掘 APRIORI算法 0-1矩阵
下载PDF
频繁闭合项目集的并行挖掘算法研究 被引量:5
10
作者 缪裕青 《计算机科学》 CSCD 北大核心 2004年第5期166-168,共3页
频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特... 频繁项目集挖掘因其在数据挖掘领域中的基础地位和广泛应用备受学术界和产业界的关注,用挖掘频繁闭合项目集代替挖掘频繁项目集是近年来提出的一个重要策略。不同于以往提出的挖掘所有频繁项目集的并行算法,本文针对频繁闭合项目集的特性及并行挖掘的特点,给出了共享存储器模型上(Shared Memory)基于频繁模式树(FP-tree)的挖掘频繁闭合项目集的并行算法(FCIPM)思想,提出了频繁闭合项目集直接判断法,性能分析表明所提技术对算法的性能提高起到了关键作用。 展开更多
关键词 频繁项目 数据挖掘 并行算法 频繁模式树 频繁闭合项目
下载PDF
基于最大频繁项目序列集挖掘DMFIA算法的改进 被引量:1
11
作者 宋卫林 徐惠民 《计算机工程与设计》 CSCD 北大核心 2007年第7期1493-1496,1500,共5页
为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进... 为了有效地解决客户序列视图数据库的数据挖掘问题,借鉴了关联规则挖掘最大频繁项目集DMFIA算法的相关思想。详细阐述了该算法,针对原算法不能有效地解决客户序列视图数据库的数据挖掘这一问题,在原算法的基础上结合序列模式提出了改进的DMFIA算法,并在原算法的基础上有了较大的改进。为了验证算法的正确性,运用Ora-cle9i数据库的PL/SQL进行了相应的验证。实验结果证实了改进算法的有效性和实用性,并具有较好的创新性和理论价值。 展开更多
关键词 数据挖掘 关联规则 序列模式 DMFIA算法 最大频繁项目 最大频繁项目序列
下载PDF
一种频繁项目集的快速挖掘算法 被引量:2
12
作者 杨君锐 《微电子学与计算机》 CSCD 北大核心 2004年第2期70-72,77,共4页
关联规则是当前数据挖掘研究的主要领域之一,发现频繁项目集是关联规则数据挖掘中的关键问题。文章提出了一种快速挖掘频繁项目集的新方法FMFI(FastMiningFrequentItemsets)。针对关联规则下频繁项目集的特性,该算法摆脱了传统的自底向... 关联规则是当前数据挖掘研究的主要领域之一,发现频繁项目集是关联规则数据挖掘中的关键问题。文章提出了一种快速挖掘频繁项目集的新方法FMFI(FastMiningFrequentItemsets)。针对关联规则下频繁项目集的特性,该算法摆脱了传统的自底向上的搜索策略,而采取了自底向上和自顶向下相结合的双向搜索方式,从而降低了扫描数据库的次数,提高了挖掘效率。 展开更多
关键词 关联规则 数据挖掘 频繁项目 数据库 搜索策略 快速挖掘算法
下载PDF
快速挖掘最大频繁项目集的新算法 被引量:1
13
作者 杨君锐 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第6期102-110,共9页
针对关联规则下最大频繁项目集的特性,提出了一种快速挖掘最大频繁项目集的新算法MMFI(miningmaximumfrequentitemsets)。该算法摆脱了传统的经典算法Apriori及其变种情况下的自底向上的搜索策略,利用集合枚举树(set enumerationtree)... 针对关联规则下最大频繁项目集的特性,提出了一种快速挖掘最大频繁项目集的新算法MMFI(miningmaximumfrequentitemsets)。该算法摆脱了传统的经典算法Apriori及其变种情况下的自底向上的搜索策略,利用集合枚举树(set enumerationtree)的变形结构采取了自顶向下的新的搜索方式,并通过其独特的启发式判断策略、候选项目集的生成策略等,大大减少侯选项目集的生成,从而降低了CPU搜索时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 最大频繁项目 算法
下载PDF
一种改进的频繁项目集挖掘算法 被引量:1
14
作者 张林 王宏海 《阜阳师范学院学报(自然科学版)》 2013年第1期54-57,共4页
针对Apriori算法需要多次扫描数据库以及可能产生庞大候选集的瓶颈问题,提出了一种改进的频繁项目集挖掘算法,该算法仅通过一次数据库的扫描生成一个链表,以比特位的方式存储项目在事物数据库中出现的位置,并在不产生候选集的基础上通... 针对Apriori算法需要多次扫描数据库以及可能产生庞大候选集的瓶颈问题,提出了一种改进的频繁项目集挖掘算法,该算法仅通过一次数据库的扫描生成一个链表,以比特位的方式存储项目在事物数据库中出现的位置,并在不产生候选集的基础上通过逻辑运算与集合运算的直接生成频繁项目集。经过实例分析,结果表明该算法相对于Apriori算法,能够在保证准确率的基础上拥有更低廉的代价。 展开更多
关键词 频繁项目 数据挖掘 APRIORI 算法 关联规则
下载PDF
一种新的频繁集的挖掘算法
15
作者 韦煜明 袁鼎荣 陈宏朝 《广西工学院学报》 CAS 2003年第2期38-41,共4页
频繁集的挖掘问题是数据挖掘的关键问题 ,本文提出了一种基于频繁树的挖掘频繁集的新方法 ,该算法从频繁项开始搜索、筛选产生符合要求的频繁结点 ,构成频繁树 ,通过有效的筛选方法和独特的构成策略 ,大大的减少了候选集的数量 。
关键词 频繁 挖掘算法 数据挖掘 频繁 频繁 候选 结点 关联规则
下载PDF
NB-MAFIA:基于N-List的最长频繁项集挖掘算法 被引量:5
16
作者 沈戈晖 刘沛东 邓志鸿 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第2期199-209,共11页
本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集... 本文在深度优先搜索的框架上,引入基于项集前缀树节点链表的项集表示方法 N-List,提出一个高效的最长频繁项集挖掘算法NB-MAFIA。N-List的高压缩率和高效的求交集方法可以实现项集支持度的快速计算,同时采用对搜索空间的剪枝策略和超集检测策略来提高算法效率。在多个真实和仿真数据集上,通过实验评估了NB-MAFIA和两个经典算法。实验结果表明NB-MAFIA在多数情况下优于其他算法,尤其在真实和稠密数据集上优势更为明显。 展开更多
关键词 数据挖掘 频繁挖掘 最长项 N-List 算法
下载PDF
一种新的频繁项集挖掘算法DS-ECLAT 被引量:2
17
作者 张毅 杨颖 陆瑞兴 《广西科学院学报》 2010年第1期19-22,共4页
在ECLAT算法的基础上,提出一种新的频繁项集挖掘算法——DS-ECLAT算法。该算法使用回写集和深度搜索最长项集两项新技术,在每次迭代中,无须扫描整个数据库,对于(K+1)项集的探索仅依赖于K项集,并生成K项回写集,下一次迭代时吸取这些回写... 在ECLAT算法的基础上,提出一种新的频繁项集挖掘算法——DS-ECLAT算法。该算法使用回写集和深度搜索最长项集两项新技术,在每次迭代中,无须扫描整个数据库,对于(K+1)项集的探索仅依赖于K项集,并生成K项回写集,下一次迭代时吸取这些回写集,减少了交运算的次数,提高了算法的执行效率。相对于ECLAT算法,新算法减少了内存的需要,具有更好的可伸缩性。 展开更多
关键词 挖掘算法 频繁 回写
下载PDF
一种挖掘最大频繁项目集的优化算法
18
作者 王晓翔 彭玉青 顾军华 《郑州轻工业学院学报(自然科学版)》 CAS 2005年第1期92-94,共3页
提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大... 提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大大减少,大大提高了挖掘效率. 展开更多
关键词 最大频繁项目 挖掘算法 APRIORI算法 优化算法 数据库 数据量 扫描 选项 产生 思想
下载PDF
使用不需要产生候选项集的频繁项集挖掘算法挖掘布尔关联规则
19
作者 万冬梅 《山西电子技术》 2002年第6期12-14,共3页
讨论了一个关于布尔关联规则挖掘的不产生候选项集的挖掘算法 ,做了一些提高算法性能的改进 ,并对其性能进行了测试。
关键词 数据挖掘 频繁 候选项 布尔关联规则 挖掘算法
下载PDF
一种基于集合的频繁项目集挖掘算法
20
作者 苏海英 《茂名学院学报》 2008年第4期62-65,共4页
频繁项目集挖掘是数据挖掘应用研究的一个重要研究内容。文章在FP-Growth算法的基础上,提出了一种基于集合的频繁项目集挖掘算法,该算法直接对FP-tree进行挖掘,不需要产生节点的条件模式基,因此在挖掘频繁模式集时节省了空间和时间,提... 频繁项目集挖掘是数据挖掘应用研究的一个重要研究内容。文章在FP-Growth算法的基础上,提出了一种基于集合的频繁项目集挖掘算法,该算法直接对FP-tree进行挖掘,不需要产生节点的条件模式基,因此在挖掘频繁模式集时节省了空间和时间,提高了算法的执行效率。最后对该算法进行了实例分析。 展开更多
关键词 关联规则 频繁项目 FP—Growth算法 基于合的FP—tree挖掘
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部