-
题名一种新型的分布式关联规则挖掘算法研究
被引量:1
- 1
-
-
作者
郭俊凤
刘大昕
王开铸
-
机构
黑龙江东方学院讲师
不详
-
出处
《电脑学习》
2008年第3期6-7,共2页
-
文摘
提出了一种新型基于压缩矩阵的分布式关联规则挖掘算法—CMDMA算法。
-
关键词
压缩关联矩阵
项集的元向量
分布式关联规则挖掘
-
Keywords
Compressed Association Matrix Vector of Itemsets Distributed Association Rules Mining
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用抽样技术和元学习的分布式关联规则挖掘算法
被引量:3
- 2
-
-
作者
李梅花
王黎明
许红涛
-
机构
郑州大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2006年第4期872-874,877,共4页
-
基金
河南省自然科学基金资助项目(0211050110)
-
文摘
结合动态项集计数技术和抽样的思想,利用元学习策略来产生频繁项集,提出了一个不共享内存的分布式关联规则挖掘算法DASM;引进了相似度的概念,并用之提高了挖掘的精确度。理论分析以及在IBM数据生成器生成的数据集上的实验均表明,DASM算法具有较高的挖掘效率和较低的通信量,适用于对效率要求较高的应用领域。
-
关键词
抽样
元学习
动态项集计数
相似度
分布式关联规则挖掘
-
Keywords
sampling
meta-learning
dynamic itemset counting
similar degree
distributed association rule mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于分布式系统下的快速关联规则挖掘算法
被引量:1
- 3
-
-
作者
黄勇
赵靖
-
机构
安徽科技学院计算机系
-
出处
《农业网络信息》
2009年第4期138-140,共3页
-
基金
安徽高校省级自然科学研究项目(KJ2009B033Z)
安徽科技学院稳定人才项目(ZRC2007138)
-
文摘
随着分布式技术的发展,基于分布式系统下关联规则挖掘算法的研究显得非常重要。分布式系统下关联规则挖掘算法的时间开销主要体现在两方面:一是频繁项目集的确定;二是网络的通讯量。为解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成算法,该算法只需对挖掘对象进行逻辑与操作,提高了频繁项目集的生成效率,将该算法结合FDM算法应用于实验挖掘,实验结果表明,算法提高了挖掘效率,是可行的。
-
关键词
分布式关联规则挖掘
算法
频繁项目集
-
Keywords
Distributed association rules mining
Algorithms
Frequent itemsets
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关联规则的分布式通信网告警相关性研究
被引量:7
- 4
-
-
作者
吴简
李兴明
-
机构
电子科技大学通信与信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2009年第11期204-207,212,共5页
-
基金
国家自然科学基金(60572091)资助
-
文摘
描述了基于数据挖掘的通信网告警相关性分析。在分布式数据库中直接运用序列算法效率很低,因为这需要大量的额外通信。为此提出了一种有效的分布式关联规则挖掘算法——EDMA,它通过局部剪枝与全局剪枝来最小化候选项集数目和通信量。在局部站点上运用先进的压缩关联矩阵CMatrix统计局部项集支持数。此外还利用项目剪枝与交易剪枝共同来减少扫描时间。最后仿真验证了EDMA比其他经典分布式算法有更高的运算效率、更低的通信开销以及更好的可扩展性。
-
关键词
网络差错管理
分布式关联规则挖掘
频繁项集
压缩关联矩阵
-
Keywords
Network fault management, Association rules distributed mining, Frequent itemsets, Compressed association matrix
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TN915.07
[电子电信—通信与信息系统]
-
-
题名基于分布数据库的快速关联规则挖掘算法
被引量:13
- 5
-
-
作者
陈耿
倪巍伟
朱玉全
孙志挥
-
机构
南京审计学院
东南大学计算机科学与工程系
东南大学计算机科学与工程系
江苏大学计算机科学与通信工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第4期165-167,194,共4页
-
基金
国家自然科学基金资助项目(编号:70371015)
江苏大学科研启动基金项目(编号:04KJD001)
-
文摘
关联规则发现是数据挖掘的重要研究内容,随着数据库中数据的不断增加,大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。分布式数据库环境下的关联规则挖掘算法中,时间开销主要体现在两方面(:1)频繁项目集的确定;(2)网络的通讯量。为了解决第一个问题,文章提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些”或”、”与”、”异或”等逻辑运算操作,显著降低了算法的实现难度。将该算法与DMA算法相结合提出改进算法FDMA。理论分析和实验结果表明,算法FDMA大大提高了关联规则挖掘的效率,算法是有效可行的。
-
关键词
频繁项目集
分布式关联规则挖掘
数据挖掘
布尔关联规则
-
Keywords
frequent itemsets,distributed association rules mining,data mining,boolean association rules
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种分布式环境下动态挖掘频繁闭项集算法
被引量:1
- 6
-
-
作者
谭峻松
首照宇
-
机构
桂林电子科技大学
-
出处
《大众科技》
2010年第9期38-40,29,共4页
-
基金
广西教育厅科研项目资助
项目编号:200911MS83
-
文摘
在分析与研究分布式数据挖掘和频繁闭项集挖掘的基础上,通过设计一个Unite_Tree算法构建全局FP-Tree树,并在全局FP-Tree树的基础上设计了一种分布式环境下动态频繁闭项集的挖掘算法D-MFCI。最后,通过仿真实验证明D-MFCI算法可以实现分布式数据库中关联规则的快速挖掘,减少生成规则的冗余度,提高规则的可读性。
-
关键词
分布式数据挖掘
分布式关联规则挖掘
频繁闭项集
动态频繁闭项集挖掘
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种改进型的分布式Lazy关联分类算法
- 7
-
-
作者
杨浩敏
马超
吴海燕
-
机构
重庆大学计算机学院
-
出处
《计算机与现代化》
2015年第8期116-120,共5页
-
文摘
分布式lazy关联分类算法(DLAC算法)指应用分布式关联规则挖掘算法的lazy关联分类算法。现有的DLAC算法存在2个主要问题:一是对多个待分类样本进行分类时效率低下;二是投影操作未分布式实现。针对上述2个问题,提出一种改进型的分布式lazy关联分类(PDLAC)算法。首先,对待分类样本进行KMeans聚类;其次,判断类内的待分类样本是否满足聚合条件,满足进行聚合,不满足则类内的每个待分类样本单独成为一类;然后,进行分布式投影并使用CDMA算法挖掘关联规则;最后,构建分类器对类内的一个或多个待分类样本进行分类。设置并行度为15进行实验:PDLAC算法所用的时间远小于DLAC算法,并且随着待分类样本数目的增加,性能提升越大。实验结果表明,PDLAC算法是解决上述2个问题的一个好方法。
-
关键词
聚合方法
分布式投影
分布式关联规则挖掘
lazy方法
关联分类
-
Keywords
aggregate method
distributed projection
distributed associative rules mining
lazy method
associative classification
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Kademlia的下关联规则挖掘算法研究
被引量:2
- 8
-
-
作者
郭鸿
黄桂敏
周娅
-
机构
桂林电子科技大学计算机与控制学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第1期221-223,323,共4页
-
基金
广西教育厅科研基金项目(200911MS83)
-
文摘
在分析和介绍了分布式关联规则挖掘方法和对等网模型Kademlia的基础上,通过改进经典的Apriori算法,设计了一种能够用于对等网模型Kademlia的分布式关联规则挖掘算法。该算法通过对其频繁项集阈值的设置,能够快速减少各结点在进行关联规则挖掘时产生的中间候选项集的数量,降低算法复杂度,提高算法执行效率,仿真实验结果表明了该算法的有效性和可扩展性。
-
关键词
分布式关联规则挖掘
对等网络
KADEMLIA
APRIORI算法
频繁项集阈值
-
Keywords
distributed association rules mining
P2P
Kademlia
Apriori algorithm
frequent item set threshold
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名水平分布数据集的隐私保护关联挖掘算法
被引量:2
- 9
-
-
作者
蒋栋栋
孙志挥
汪晓刚
吴英杰
吕建华
-
机构
江苏省邮电规划设计院有限责任公司
东南大学计算机科学与工程系
南京擎天科技有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第2期60-62,共3页
-
基金
国家自然科学基金资助项目"中观审计中的数据挖掘应用研究"(70371015)
国家自然科学基金资助项目(60603040)
-
文摘
研究水平分布数据集的隐私保护关联规则挖掘算法。针对现有算法需要多次扫描数据集的缺点,提出一种只须对数据集进行2次扫描、基于分布式FP-tree的隐私保护挖掘算法。该算法可以有效降低通信量,能在保证准确度的同时保护原始数据。
-
关键词
隐私保护
分布式关联规则挖掘
频繁项集
多方安全计算
-
Keywords
privacy preserving
distributed association rule mining
frequent itemset
secure multi-party computation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-