-
题名一种基于单事务项集组合的频繁项集挖掘算法
被引量:4
- 1
-
-
作者
曾波
-
机构
重庆工商大学商务策划学院
-
出处
《计算机科学》
CSCD
北大核心
2008年第1期196-197,226,共3页
-
基金
重庆市自然科学基金(2006BA6015)重点资助项目
-
文摘
Apriori是挖掘频繁项集的基本算法,目前该算法及其优化变种都没有解决候选项及重复扫描事务数据库的问题。文章通过对Apriori及其优化算法的深入探究,提出了一种基于单事务组合项集的挖掘算法,该算法在一个事务内部对"数据项"进行组合,在事务数据库中对所有相同"项集"进行计数。不经过迭代过程,不产生候选项集,所有频繁项集的挖掘过程只需对事务数据库一次扫描,提高了频繁项集挖掘效率。
-
关键词
频繁项集
APRIORI
单事务项集组合
候选项
-
Keywords
Frequent itemsets,Apriori, Single transaction itemsets combination, Candidate item
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于频繁项集特性的Apriori算法的改进
被引量:25
- 2
-
-
作者
高宏宾
潘谷
黄义明
-
机构
五邑大学信息学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第10期2273-2275,2378,共4页
-
文摘
Apriori算法是关联规则中一种重要算法。Apriori算法在求出频繁项集的过程中,需要扫描事务项集里的数据。由于事务项集里只是部分数据有用,所以改进算法,缩小所需扫描的事务项集大小,并提出了一种简单的数据结构——树型结构来存储事务项集数据,使得算法在数据集量巨大时,性能得到有效提高,并用实例验证了这些改进能够正确、有效、快速地实现该算法。
-
关键词
数据挖掘
关联规则
频繁项集
APRIORI算法
事务项集
-
Keywords
data mining
association rule
frequent itemset
apriori algorithm
transaction itemset
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于差分隐私的频繁项集挖掘的启发式算法
被引量:4
- 3
-
-
作者
陈婷婷
龙士工
-
机构
贵州大学贵州省公共大数据重点实验室
贵州大学计算机科学与技术学院
-
出处
《计算机工程与设计》
北大核心
2019年第2期412-417,共6页
-
基金
贵州省公共大数据重点实验室开放课题基金项目(2017001)
-
文摘
针对频繁项目集挖掘结果直接发布可能会造成严重的个人隐私泄露,提出一种满足差分隐私的频繁项目集挖掘算法。为降低差分隐私的全局敏感度,根据候选项的覆盖分数和项集与事务距离两个指标,采用启发式截断算法进行事务截断,尽可能多地使截断后的事务保留原事务的频繁项信息。采用最大支持度估计策略生成候选项集,降低因事务截断和剪枝操作带来的误差。实验结果对比分析表明,提出算法满足差分隐私保护,挖掘的频繁项集具有较好的效用。
-
关键词
差分隐私
频繁项目集
启发式截断
覆盖分数
项集与事务距离
最大支持度估计策略
-
Keywords
differential privacy
frequent itemsets
heuristic truncation
cover score
distance between an itemset and a sub-transaction
maximum support estimation strategy
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-