摘要
为了避免用户通过"二次挖掘"才能得到有用的结果集,本文提出了一种新的约束最大频繁模式挖掘算法CSMFP-Max。CSMFP-Max算法基于CFP树和对称矩阵,在挖掘过程中采用了多种剪枝策略并结合了自顶向下和自底向上的双向搜索策略,大大缩小了候选集规模,避免了不必要的条件CFP树的产生。理论分析和实验结果表明CSMFP-Max算法是一种高效的约束最大频繁模式挖掘算法,具有良好的时空效率。
This thesis proposes a new algorithm CSMFP-Max for mining constrained maximal frequent patterns to avoid users using second time to get useful results. And during the mining process, this algorithm based on CFP-tree and symmetrical matrix introduces many pruning strategies and a search strategy that integrating the top to down and down to top method, which reduce the size of candidates and avoid generating numerous unnecessary term CFP-trees. Theoretical analysis and experimental results show that CSMFP- Max is a high performance algorithm for mining constrained maximal frequent patterns. It has better efficiency in time and space.
出处
《微计算机信息》
2009年第15期143-145,共3页
Control & Automation
基金
基金申请人:谢伙生
项目名称:邻近序列模式挖掘算法及其应用研究
基金颁发部门:福建省教育厅(JB07023)
基金申请人:谢伙生
项目名称:Weblogs中增量挖掘邻近序列模式算法研究
基金颁发部门:福州大学科技发展基金(2006-XQ-22)
关键词
约束最大频繁模式
对称矩阵
CFP树
constrained maximal frequent pattern
symmetrical matrix
CFP-tree