-
题名无项头表的FP-Growth算法
被引量:8
- 1
-
-
作者
凌绪雄
王社国
李洋
苗再良
-
机构
河北工程大学信息与电气工程学院
浪潮集团博士后工作站
山东大学博士后流动站
-
出处
《计算机应用》
CSCD
北大核心
2011年第5期1391-1394,共4页
-
文摘
针对FP-Growth算法中频繁模式树的遍历低效问题,提出了一种无项头表的频繁模式增长算法。该算法利用递归回溯的方式遍历频繁模式树以求取条件模式基,解决了对同一树路径多次重复遍历的问题。从理论分析和实际挖掘能力两方面,将新算法与FP-Growth算法进行了对比。结果表明,新算法有效减少了条件模式基的搜索开销,使频繁模式挖掘的效率提高了2~5倍,在时间和空间性能上均优于FP-Growth算法。将该算法应用于通信告警关联规则挖掘,较快地挖掘出了关联规则结果,且正确规则的覆盖率达到了83.3%。
-
关键词
项头表
频繁模式
关联规则
告警关联
数据挖掘
-
Keywords
item header table
frequent pattern
association rule
alarm association
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于改进FP-tree的最大频繁项目集挖掘算法
被引量:8
- 2
-
-
作者
马丽生
姚光顺
杨传健
-
机构
滁州学院计算机与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2012年第2期326-329,共4页
-
基金
安徽省高校省级自然科学研究项目(KJ2010B421
KJ2011Z276)
+1 种基金
安徽省高校省级优秀青年人才基金项目(2010SQRL137
2011SQRL123)
-
文摘
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项集的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。
-
关键词
频繁项目集
最大频繁项目集
条件模式基
项头表
剪枝策略
压缩策略
-
Keywords
frequent itemset
maximal frequent itemset
conditional pattern base
item header table
pruning strategy
compression strategy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FP-tree的快速构建算法
被引量:2
- 3
-
-
作者
陈治平
谭义红
李学勇
栾悉道
-
机构
长沙学院信息与计算科学系
-
出处
《计算机应用》
CSCD
北大核心
2011年第2期438-440,453,共4页
-
基金
湖南省教育厅科研项目(10C040907B007)
长沙市科技计划项目(K0902210-11)
-
文摘
数据库的访问频度是影响关联规则挖掘性能的关键因素之一。通过研究FP-tree算法,提出了一种基于FP-tree的快速构建算法,使FP-tree的构建过程仅需一次数据库扫描。该算法通过动态调整项头表中各项的顺序,同时动态修正FP-tree中项的出现顺序与项头表中各项出现顺序不一致的节点。最后,通过对项头表中非频繁项的剔除与FP-tree中对应项节点的清理,完成FP-tree的构建过程。实验结果证明了该算法的有效性。
-
关键词
关联规则
项头表
频繁项
-
Keywords
association rule
Item Entry Table(IET)
frequent item
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种无候选项的闭合序列模式挖掘算法
被引量:1
- 4
-
-
作者
杨斐
张万桢
陆垂伟
-
机构
湖北理工学院计算机学院
桂林电子科技大学
-
出处
《计算机应用与软件》
CSCD
2016年第3期279-283,共5页
-
基金
湖北省自然科学基金项目(2013CFB039)
湖北省教育厅重点科学研究项目(D20144403)
+1 种基金
湖北省教育厅科学研究项目(B2013064)
湖北理工学院优秀青年科技创新团队项目(13xtz10)
-
文摘
算法Clo Span在挖掘闭合序列模式时分两阶段进行,首先产生候选的闭合序列模式,然后在此基础上挖掘闭合序列模式。针对Clo Span算法中大量候选模式影响挖掘效率的问题,提出改进的算法ss Clo Span。该算法在序列模式增长时,利用支持度和末节点哈希表剪枝非闭合模式,同时利用频繁项头表进行闭合性检测。实验结果表明,对于不含项集项的序列,当存在较长频繁序列时,挖掘效率得到了有效的提高。
-
关键词
闭合序列模式
支持数剪枝
末节点哈希表
频繁项头表
-
Keywords
Closed sequential pattern
Support number pruning
Last node hash table
Frequent item header table
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-