题名 基于动态项集计数的加权频繁项集算法
被引量:1
1
作者
秦丽君
罗雄飞
机构
中国科学院软件研究所
中国科学院研究生院
出处
《计算机工程》
CAS
CSCD
2012年第3期31-33,共3页
基金
国家"863"计划基金资助项目(2007AA040702)
文摘
基于Apriori的加权频繁项集挖掘算法存在扫描数据集次数多的问题。为此,提出一种基于动态项集计数的加权频繁项集算法。该算法采用权值键树的数据结构和动态项集计数的方法,满足向下闭合特性,并且动态生成候选频繁项集,从而减少扫描数据集的次数。实验结果证明,该算法生成的加权频繁项集具有较高的效率和时间性能。
关键词
数据挖掘
加权频繁项集 挖掘
动态项集 计数
加权支持度
权值键树
向下闭合特性
最大权值
Keywords
data mining
weighted frequent itemset mining
dynamic itemset counting
weighted support degree
weighted trie tree
downwardclosure property
maximum weight
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
题名 一种新的动态频繁项集挖掘方法
被引量:1
2
作者
李广原
雷鸿
龙珑
机构
广西师范学院信息技术系
出处
《计算机工程与应用》
CSCD
北大核心
2008年第21期209-211,共3页
基金
广西自然科学基金(the Natural Science Foundation of Guangxi of China under Grant No.桂科自 0679073)
广西教育厅资助科研课题(the Research Project of Department of Education of Guangxi
China under Grant No.桂教科研[2006]26 号)
文摘
频繁项集挖掘是关联规则挖掘的重要步骤。在数据动态变化的环境下进行关联规则挖掘具有重要的现实意义。提出一种动态频繁项集挖掘算法,该算法建立在前一阶段挖掘的基础上,能避免过多地扫描数据库而影响挖掘性能,在最后生成全局频繁项集时,不需要全程扫描数据库,根据之前挖掘结果有选择地扫描相关的事务子集。实验表明,该算法挖掘性能远远优于Apriori算法,能有效地实现在数据动态变化环境下的挖掘频繁项集。
关键词
数据挖掘
关联规则挖掘
动态 频繁项集 挖掘
Keywords
data mining
association rules mining
dymamic frequent itemset mining
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 挖掘大型数据库中的Apriori算法及其改进
被引量:17
3
作者
宋中山
机构
中南民族大学计算机科学学院
出处
《中南民族大学学报(自然科学版)》
CAS
2003年第1期54-57,共4页
基金
国家民委科研基金资助项目 (990 10 1)
文摘
指出了 Apriori算法是一种有效的关联规则挖掘算法 ,分析和探讨了 Apriori算法 ,并给出了该算法的实现思想 ,通过实例说明了算法的执行过程 ,提出了对 Apriori算法进行改进的一些方法 :散列、事务压缩、划分、选样及动态项集计数 .使用这些技术提高了算法的效率 .
关键词
数据挖掘
大型数据库
关联规则
APRIORI算法
事务压缩
动态项集
知识发现
Keywords
data mining
association rules
Apriori algorithms
frequent itemset
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 利用抽样技术和元学习的分布式关联规则挖掘算法
被引量:3
4
作者
李梅花
王黎明
许红涛
机构
郑州大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2006年第4期872-874,877,共4页
基金
河南省自然科学基金资助项目(0211050110)
文摘
结合动态项集计数技术和抽样的思想,利用元学习策略来产生频繁项集,提出了一个不共享内存的分布式关联规则挖掘算法DASM;引进了相似度的概念,并用之提高了挖掘的精确度。理论分析以及在IBM数据生成器生成的数据集上的实验均表明,DASM算法具有较高的挖掘效率和较低的通信量,适用于对效率要求较高的应用领域。
关键词
抽样
元学习
动态项集 计数
相似度
分布式关联规则挖掘
Keywords
sampling
meta-learning
dynamic itemset counting
similar degree
distributed association rule mining
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]