-
题名基于动态项集计数的加权频繁项集算法
被引量:1
- 1
-
-
作者
秦丽君
罗雄飞
-
机构
中国科学院软件研究所
中国科学院研究生院
-
出处
《计算机工程》
CAS
CSCD
2012年第3期31-33,共3页
-
基金
国家"863"计划基金资助项目(2007AA040702)
-
文摘
基于Apriori的加权频繁项集挖掘算法存在扫描数据集次数多的问题。为此,提出一种基于动态项集计数的加权频繁项集算法。该算法采用权值键树的数据结构和动态项集计数的方法,满足向下闭合特性,并且动态生成候选频繁项集,从而减少扫描数据集的次数。实验结果证明,该算法生成的加权频繁项集具有较高的效率和时间性能。
-
关键词
数据挖掘
加权频繁项集挖掘
动态项集计数
加权支持度
权值键树
向下闭合特性
最大权值
-
Keywords
data mining
weighted frequent itemset mining
dynamic itemset counting
weighted support degree
weighted trie tree
downwardclosure property
maximum weight
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用抽样技术和元学习的分布式关联规则挖掘算法
被引量:3
- 2
-
-
作者
李梅花
王黎明
许红涛
-
机构
郑州大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2006年第4期872-874,877,共4页
-
基金
河南省自然科学基金资助项目(0211050110)
-
文摘
结合动态项集计数技术和抽样的思想,利用元学习策略来产生频繁项集,提出了一个不共享内存的分布式关联规则挖掘算法DASM;引进了相似度的概念,并用之提高了挖掘的精确度。理论分析以及在IBM数据生成器生成的数据集上的实验均表明,DASM算法具有较高的挖掘效率和较低的通信量,适用于对效率要求较高的应用领域。
-
关键词
抽样
元学习
动态项集计数
相似度
分布式关联规则挖掘
-
Keywords
sampling
meta-learning
dynamic itemset counting
similar degree
distributed association rule mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-