-
题名基于Kademlia的下关联规则挖掘算法研究
被引量:2
- 1
-
-
作者
郭鸿
黄桂敏
周娅
-
机构
桂林电子科技大学计算机与控制学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第1期221-223,323,共4页
-
基金
广西教育厅科研基金项目(200911MS83)
-
文摘
在分析和介绍了分布式关联规则挖掘方法和对等网模型Kademlia的基础上,通过改进经典的Apriori算法,设计了一种能够用于对等网模型Kademlia的分布式关联规则挖掘算法。该算法通过对其频繁项集阈值的设置,能够快速减少各结点在进行关联规则挖掘时产生的中间候选项集的数量,降低算法复杂度,提高算法执行效率,仿真实验结果表明了该算法的有效性和可扩展性。
-
关键词
分布式关联规则挖掘
对等网络
KADEMLIA
APRIORI算法
频繁项集阈值
-
Keywords
distributed association rules mining
P2P
Kademlia
Apriori algorithm
frequent item set threshold
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种自适应阈值的简洁性约束频繁项目集挖掘算法
被引量:1
- 2
-
-
作者
任永功
吕朕
孙宇奇
-
机构
辽宁师范大学计算机与信息技术学院
-
出处
《计算机科学》
CSCD
北大核心
2011年第9期155-157,196,共4页
-
基金
国家自然科学基金(60603047)
教育部留学回国人员科研启动基金
+2 种基金
辽宁省科技计划(2008216014)
辽宁省教育厅高等学校科研基金(L2010229)
大连市优秀青年科技人才基金(2008J23JH026)资助
-
文摘
基于约束关联挖掘,近几年在国际上受到较大关注。从许多约束的关联挖掘算法中发现,传统的约束阈值大多是通过专家给定或经过反复试验得出的,缺乏用户反馈与客观依据的支持。为了解决此问题,提出一种面向用户需求的阈值构造方法,该方法引用正态分布理论获得自适应约束阈值,并应用简洁性约束对FGC算法进行改进;同时提出一种快速、直观、有效的频繁项目集挖掘算法。实验证明,该算法在增强系统可用性的同时降低了算法运行时间。
-
关键词
频繁模式树
频繁项目集
简洁性约束
自适应阈值
-
Keywords
FP-Tree
frequent item-sets
Succinct constraints
Adaptive threshold
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于K均值聚类的大数据频繁项集挖掘研究
被引量:7
- 3
-
-
作者
张娅
-
机构
电子科技大学
-
出处
《计算机仿真》
北大核心
2020年第8期457-461,共5页
-
文摘
针对传统大数据项集挖掘方法存在占用内存较多、挖掘效率较低的问题,提出新的基于K均值聚类的大数据频繁项集挖掘方法。通过对K均值聚类的区间标度变量、二元变量等相似度量的分析来表示样本之间的相似度与离散度,根据样本数据的不同属性选择对应矩阵类型;利用频繁项集自身的约束性质压缩空间,缩小挖掘范围;在K均值聚类基础上,采用fg-growth算法将目标数据高度压缩在fp-tree结构中,并命令原始聚类质心和数量,将其作为K均值的输入,实现大数据频繁项集挖掘。仿真结果证明,研究方法有效降低了挖掘计算复杂度,可保证在内存开销基本不变的情况下高效率挖掘大数据频繁项集。
-
关键词
频繁项集挖掘
样本相似度
准则函数
相似度阈值
-
Keywords
frequent item set mining
Sample similarity
Criterion function
Similarity threshold
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进频繁模式树的最大频繁项目集更新挖掘算法
- 4
-
-
作者
赵群礼
郭玉堂
史君华
-
机构
合肥师范学院计算机学院
-
出处
《井冈山大学学报(自然科学版)》
2018年第4期43-48,64,共7页
-
基金
国家自然科学基金(61503116)
安徽省高校自然科学研究重点项目(KJ2016A585)
-
文摘
在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。
-
关键词
关联规则
最大频繁项目集
改进频繁模式树
最小支持度阈值
-
Keywords
association rules
maximal frequent item sets
improved frequent pattern tree
minimum support threshold
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-