-
题名快速挖掘全局最大频繁项目集
被引量:27
- 1
-
-
作者
陆介平
杨明
孙志挥
鞠时光
-
机构
东南大学计算机科学与工程系
江苏大学计算机科学与通信工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2005年第4期553-560,共8页
-
基金
国家自然科学基金
江苏省自然科学基金~~
-
文摘
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining globalmaximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的.
-
关键词
分布式数据库
数据挖掘
频繁模式树
全局最大频繁项目集
-
Keywords
Computer networks
Data transfer
Distributed database systems
Information management
Theorem proving
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-