期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

FP-growth算法的实现方法研究被引量：27

Research on Implementation of the FP-growth Algorithm

下载PDF

导出

摘要事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。 Mining frequent patterns in transaction databases,as an essential role in many data mining tasks such as the association rule mining,has been widely studied for many years.Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach.However,candidate set generation is costly if there exist prolific patterns or long patterns.Jianwei Han et al propose a frequent pattern tree structure and a FP-growth algorithm based on this structure that can mine the frequent patterns by pattern fragment growth.Due to different methods will result in different performance,in this paper several methods to implement the FP-growth algorithm are discussed.The performance is studied,analyzed and compared on several canonical datasets.

作者王新宇杜孝平谢昆青

机构地区北京大学信息科学技术学院北京航空航天大学软件学院

出处《计算机工程与应用》 CSCD 北大核心 2004年第9期174-176,共3页 Computer Engineering and Applications

基金国家973重点基础研究发展规划项目(编号:G1999032705) 留学回国人员科研启动基金资助

关键词频繁模式关联规则数据挖掘算法 Frequent Pattern,Association Rule,Data Mining,Algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1[1]J Han,Micheline Kamber. Data Mining:Concepts and Techniques[M].Morgan Kaufmann Publishers,2001
2[2]R Agrawal,R Srikant. Fast algorithms for mining association rules[C].In: VLDB ′94,1994: 487～499
3[3]R Agrawal ,T Imielinski ,A Swami. Mining association rules between sets of items in large databases[C].In:Proc 1993 ACM-SIGMOD Int Conf Management of Data (SIGMOD′93), Washington, DC, 1993-05:207～216
4[4]J S Park ,M S Chen,P S Yu. An effective hash-based algorithm for mining association rules[C].In:SIGMOD'95,1995:175～186
5[5]J Han,J Pei,Y Yin. Mining frequent patterns without candidate generation[C].In: Proc ACM SIGMOD, 2000:1～12
6[6]C A Shaffer. Data Structures and Algorithm Analysis[M].Prentice Hall,1997

同被引文献239

1李云鹏.智能告警专家处理系统在南通电网的应用[J].江苏电机工程,2008,27(5):48-50. 被引量：8
2秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
3周琪锋,张立臣.数据挖掘在实验系统的应用[J].科技资讯,2007,5(14):101-102. 被引量：4
4施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
5邓砚谷,王丽珍.对FP-Tree头表节点数据结构的改进[J].计算机工程与应用,2004,40(25):176-178. 被引量：3
6杨明,孙志挥,宋余庆.快速更新全局频繁项目集[J].软件学报,2004,15(8):1189-1197. 被引量：18
7陈安龙,唐常杰,陶宏才,元昌安,谢方军.基于极大团和FP-Tree的挖掘关联规则的改进算法[J].软件学报,2004,15(8):1198-1207. 被引量：30
8张锋,常会友,衣杨.基于规则的电子商务推荐系统模型和实现[J].计算机集成制造系统,2004,10(8):898-902. 被引量：11
9廖立,忻建华,翟海青,卫振华.短期负荷预测模型及其影响因素[J].上海交通大学学报,2004,38(9):1544-1547. 被引量：14
10朱秋萍,毛平平,罗俊.基于关联规则的入侵检测系统[J].计算机工程与应用,2004,40(26):160-162. 被引量：7

<12 3 4 5…24 >

引证文献27

1王艳辉,吴斌,王柏.频繁子图挖掘算法综述[J].计算机科学,2005,32(10):193-196. 被引量：12
2孙志强.基于FP-Growth的入侵检测研究[J].计算机技术与发展,2006,16(12):233-236.
3何宏,肖伟平,郭潇婕.稀疏矩阵的关联规则挖掘算法研究[J].湖南工程学院学报（自然科学版）,2007,17(1):49-51.
4肖峻,张晶,朱涛,史常凯,张海平.基于关联分析的城市用电负荷研究[J].电力系统自动化,2007,31(17):103-107. 被引量：24
5苏海英.一种基于集合的频繁项目集挖掘算法[J].茂名学院学报,2008,18(4):62-65.
6尚志刚,尹绍宏.基于动态规划的最大频繁项目集挖掘研究[J].计算机与数字工程,2009,37(10):51-54. 被引量：2
7陈冬菊,张东站,段江娇.FVTreeMiner：无序频繁子树挖掘算法[J].计算机技术与发展,2010,20(5):9-12.
8王江伟,郭民.关联规则在电子商务推荐系统中的应用[J].现代电子技术,2011,34(19):179-182. 被引量：6
9王远敏.图像数据库关联规则的挖掘方法研究[J].数字技术与应用,2012,30(10):83-84. 被引量：1
10孙芙蕊,艾贝贝,赵雯华,覃健,蔡忠亮,万幼.某高校GIS毕业生来源地与去向地的空间关联模式[J].测绘地理信息,2015,40(1):87-90. 被引量：2

二级引证文献111

1鲁慧民,冯博琴,宋擒豹.频繁子图挖掘研究综述[J].微电子学与计算机,2009,26(3):156-161. 被引量：1
2陈勇,李胜利,郑永志.运用数据挖掘构建智能电网调度运行分析系统的研究[J].自动化博览,2009,0(S1):26-29. 被引量：1
3周军,姜元春,林文龙.基于有向带权图的Web用户浏览行为模型[J].情报理论与实践,2008,31(5):795-798. 被引量：1
4吴甲,陈崚.一种快速的频繁子图挖掘算法[J].计算机应用,2008,28(10):2533-2536. 被引量：4
5乐欢,王主丁,肖栋柱,叶晓龙,赵俊光.基于空区推论的空间负荷预测分类分区实用法[J].电力系统自动化,2009,33(7):81-85. 被引量：26
6戴小廷,陈荣思.数据挖掘在电力系统中的应用[J].重庆科技学院学报（自然科学版）,2009,11(3):141-144. 被引量：3
7刘振,杨路明,彭佳扬.基于频繁模式树的频繁连通闭图集挖掘算法[J].计算机技术与发展,2009,19(5):37-40.
8何永秀,陶卫君,杨卫红,戴爱英,蔡琦,Furong LI.基于解释结构模型的城市电力负荷预测[J].电力系统自动化,2009,33(20):37-42. 被引量：9
9刘自发,陈艳旭,张杰超.基于AHP和TOPSIS法的空间负荷预测[J].电力科学与技术学报,2009,24(4):44-48. 被引量：8
10戴小廷.Apriori算法的改进及其在电力数据挖掘中的应用[J].沈阳理工大学学报,2010,29(1):18-22. 被引量：5

<12 3 4 5…12 >

1原娇杰,赵杰文.基于Web的数据挖掘[J].软件导刊,2006,5(10):18-19. 被引量：1
2黄劲潮.SSL安全通信在电子商务中的应用[J].中国科技信息,2007(12):108-108. 被引量：3
3陈文,王诗兵.FP-growth算法的一种优化实现[J].阜阳师范学院学报（自然科学版）,2005,22(2):56-58. 被引量：1
4舒伟权.基于校园网管理的VLAN技术研究[J].浙江国际海运职业技术学院学报,2007,3(3):1-3. 被引量：1
5董宇,刘富强.基于web的数据挖掘系统的研究与设计[J].电子技术（上海）,2008,0(11):26-28. 被引量：1
6贾桂霞,张永.基于关联模式挖掘的决策规则提取方法[J].计算机工程与设计,2006,27(12):2175-2177. 被引量：2
7赵琛.基于PKI的CA认证系统的研究[J].信息安全与技术,2011,2(10):22-24. 被引量：3
8许国迎.基于网页浏览的群体用户兴趣模式挖掘[J].电脑迷（数码生活）（上旬刊）,2013(1):66-67.
9印鉴,张钢,陈忆群.基于Honeynet的网络入侵模式挖掘[J].计算机工程与应用,2004,40(11):114-117. 被引量：5
10辛忆培.DDoS攻击的检测算法研究[J].信息安全与技术,2013,4(9):17-19. 被引量：2

计算机工程与应用

2004年第9期

相关作者

相关机构

相关主题

;

使用帮助返回顶部