-
题名基于散列的频繁项集分组算法
被引量:1
- 1
-
-
作者
王红梅
胡明
-
机构
吉林大学计算机科学与技术学院
长春工业大学计算机科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2013年第11期3045-3048,3089,共5页
-
基金
国家自然科学基金资助项目(61133011)
吉林省自然科学基金资助项目(20101525)
-
文摘
Apriori算法是频繁项集挖掘的经典算法。针对Apriori算法的剪枝操作和多次扫描数据集的缺点,提出了基于散列的频繁项集分组(HFG)算法。证明了2-项集剪枝性质,采用散列技术存储频繁2-项集,将Apriori算法剪枝操作的时间复杂度从O(k×|L k|)降低到O(1);定义了首项的子项集概念,将数据集划分为以I i为首项的数据子集并采用分组索引表存储,在求以I i为首项的频繁项集时,只扫描以I i为首项的数据子集,减少了对数据集扫描的时间代价。实验结果表明,由于HFG算法的剪枝操作产生了累积效益,以及分组扫描排除了无效的项集和元组,使得HFG算法在时间性能方面与Apriori算法相比有较大提高。
-
关键词
频繁项集
2-项集剪枝
散列表
首项分组
索引表
-
Keywords
frequent itemset
2-length itemset pruning
Hash list
first term grouping
index list
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于兴趣度的正负关联规则挖掘算法研究
- 2
-
-
作者
郭燕萍
-
机构
山西大学商务学院
-
出处
《农业网络信息》
2015年第8期51-55,共5页
-
基金
山西大学商务学院科研基金项目(编号:2014011)
-
文摘
为了解决负关联规则挖掘中海量项集问题和一级剪枝策略效率不高的问题,本文在研究关联规则相关性和兴趣度的基础之上,提出了一种计算项集兴趣度的数学模型,引入了有趣2项集的概念,设计了基于兴趣度的项集剪枝和关联规则剪枝的二级剪枝策略及实现二级剪枝的正负关联规则挖掘算法。
-
关键词
兴趣度
有趣2-项集
剪枝
正负关联规则
-
Keywords
interestingness
interesting 2-itemset
pruning
positive and negative association rules
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
-
-
题名二项集剪枝技术研究
- 3
-
-
作者
黄建业
苏毅娟
-
机构
广西师范大学计算机系
广西师范学院数学与计算机科学系
-
出处
《广西师范学院学报(自然科学版)》
2006年第1期59-62,共4页
-
基金
广西区教育厅科学研究项目[区间值数据库中知识发现]资助
-
文摘
在现有的关联规则算法的基础上,深入分析了经典算法的内涵,提出了剪枝候选二项集的改进算法,有效的控制候选二项集的生成,得到传统算法中部分候选二项集,从而减少扫描数据库的运算量.与Apriori算法相比,效率明显提高.
-
关键词
二项集
剪枝技术
研究
-
Keywords
2 - itemsets
pruning
research
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-