-
题名最大目标频繁模式挖掘算法研究
被引量:2
- 1
-
-
作者
李清勇
秦亮曦
施智平
史忠植
-
机构
中科院计算所智能信息处理重点实验室
中国科学院研究生院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第33期184-188,共5页
-
基金
国家自然科学基金项目资助(编号:30170231
60203027)
国家863高技术研究发展计划项目(编号:2002AA135230-D)
-
文摘
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎样根据用户需求直接挖掘用户感兴趣的目标模式是该文的研究目标。文章在FP-树的基础上设计了紧缩的、非冗余的TFP-树,它能有效过滤与目标模式无关的项和事务,而仅保留与目标模式相关的信息,缩小TFP-树的大小规模。同时根据TFP-树的规律和特点,笔者设计了最大目标频繁模式挖掘算法,算法的结果模式具有以下两个特点:(1)满足用户需求的目标模式;(2)最大模式。该实验结果验证了TFP-树算法是有效的,而且显著改善了FP-树算法的性能。
-
关键词
数据挖掘
频繁模式
最大目标频繁模式
TFP-树
FP-树
-
Keywords
data mining,frequent pattern,maximum target frequent pattern,TFP-tree,FP-tree
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名目标频繁模式挖掘算法研究
- 2
-
-
作者
梁碧珍
陆月然
耿立中
秦亮曦
-
机构
百色学院数学与计算机信息工程系
清华大学机械工程学院
广西大学计算机与电子信息学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2010年第10期108-111,共4页
-
基金
广西教育厅项目(200708MS)
百色学院重点项目(2007KA03)
-
文摘
通用的频繁模式挖掘算法通常产生庞大的频繁模式集,其中很多是用户不感兴趣的非目标模式。要排除这些非目标模式,用户必须进行"二次挖掘"。TFP-growth虽然生成所有最大目标频繁模式,但要从中获得目标频繁模式,还需经过"二次挖掘"。若在挖掘的早期就对非目标频繁模式的产生加以限制,则有望提高算法的效率。本文在TFP-growth和SFP-growth的基础上,提出一种目标频繁模式挖掘算法STFP-growth,通过对TFP-树的排序、根据树根结点的不同情形采用不同的建子树方法和目标频繁模式筛选方法等来提高算法的效率。STFP-growth挖掘的结果是所有满足用户需求的目标频繁模式,不需"二次挖掘"。实验表明,STFP-growth的效率高于TFP-growth,也明显优于Apriori和Eclat。
-
关键词
频繁模式
目标频繁模式
最大目标频繁模式
挖掘算法
-
Keywords
frequent pattern
target frequent pattern
maximum target frequent pattern
mining algorithm
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-