期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
改进的数据库一次扫描快速Apriori算法 被引量:8
1
作者 张春生 《计算机工程与设计》 CSCD 北大核心 2009年第16期3811-3813,共3页
分析了目前众多的Apriori算法的改进算法,指出其不完备性,提出了一种事务的二元组表示法,该二元组直接用字段的值串和串的出现次数来替换原始事务数据库,并在此基础上进行扫描,该表示法所占内存大小只取决于数据库的基,而与数据库的大... 分析了目前众多的Apriori算法的改进算法,指出其不完备性,提出了一种事务的二元组表示法,该二元组直接用字段的值串和串的出现次数来替换原始事务数据库,并在此基础上进行扫描,该表示法所占内存大小只取决于数据库的基,而与数据库的大小无关,整个过程只进行一次数据库扫描,其它工作都在内存中完成,在数据库的基较小时,表现出良好的性能。同时,定义了一种基于该二元组表示法的索引结构来表示频繁项集,该方案占用内存少,速度快。 展开更多
关键词 改进 关联规则 数据库 一次扫描 apriori算法
下载PDF
基于Apriori算法的降低数据库扫描记录数的挖掘算法研究
2
作者 安颖 马桂真 《电子技术与软件工程》 2020年第23期137-138,共2页
本文首先介绍了经典的关联规则挖掘算法--Apriori算法。该算法采用了逐层搜索的迭代方法,对于数据库的扫描问题需要通过重复扫描来计算侯选项集的支持度计数,从而严重影响了运行效率。本文提出了一种改进算法,即通过减少数据库扫描次数... 本文首先介绍了经典的关联规则挖掘算法--Apriori算法。该算法采用了逐层搜索的迭代方法,对于数据库的扫描问题需要通过重复扫描来计算侯选项集的支持度计数,从而严重影响了运行效率。本文提出了一种改进算法,即通过减少数据库扫描次数的方法提高Apriori算法的效率。 展开更多
关键词 数据挖掘 apriori算法 数据库 扫描
下载PDF
基于事务线索树的一次扫描关联规则增量挖掘算法 被引量:1
3
作者 业宁 董逸生 王厚立 《应用科学学报》 CAS CSCD 2004年第2期200-204,共5页
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用... 首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少.该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能.通过大量的实验数据进行比较,该算法的速度约是Apriori算法的10倍. 展开更多
关键词 事务线索树 一次扫描关联规则 增量挖掘算法 可伸缩性 频繁集 事务数据库
下载PDF
基于扫描空间约简的Association规则开采算法
4
作者 鲁汉榕 江红钢 费晓燕 《空军雷达学院学报》 2002年第2期30-31,共2页
提出了一种基于扫描空间约简的Association规则开采算法(RBM),改进了传统Apriori算法的空间扫描效率.实验结果指出,当扫描次数N较小,数据库规模较大,支持度较小时,算法的性能改善尤其明显.
关键词 开采算法 约简 扫描 apriori算法 支持度 规则 数据库 性能 实验结果 改善
下载PDF
关联规则算法的研究 被引量:9
5
作者 文拯 梁建武 陈英 《计算机技术与发展》 2009年第5期56-58,共3页
Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。文中针对传统的Apri-ori算法需要多次扫描数据库,由此导致的性能瓶颈及效率问题,提出了一种改进的关联规则挖掘算法(AAC算法)。该算法只需一次扫描数... Apriori算法是发现频繁项目集的经典算法,但是该算法需反复扫描数据库,因此效率较低。文中针对传统的Apri-ori算法需要多次扫描数据库,由此导致的性能瓶颈及效率问题,提出了一种改进的关联规则挖掘算法(AAC算法)。该算法只需一次扫描数据库即可完成所有频繁项集的搜索,极大地提高了算法的效率。 展开更多
关键词 AAC算法 关联规则 数据挖掘 apriori算法 一次扫描数据库的apriori
下载PDF
一种挖掘最大频繁项目集的优化算法
6
作者 王晓翔 彭玉青 顾军华 《郑州轻工业学院学报(自然科学版)》 CAS 2005年第1期92-94,共3页
提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大... 提出一种与Apriori算法思想截然相反的算法,称为组分解挖掘算法GDMA(Grouping_Decompo sitionMiningAlgorithm).该算法通过分解较大的非频繁项目集来产生较小候选项目集,使得扫描数据库次数明显减少,同时产生的候选项目集的数据量也大大减少,大大提高了挖掘效率. 展开更多
关键词 最大频繁项目集 挖掘算法 apriori算法 优化算法 数据库 数据 扫描 选项 产生 思想
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部