FP-Growth算法的改进被引量：25

Improved algorithm based on FP-Growth

下载PDF

导出

摘要基于FP树的FP-Growth算法在挖掘频繁模式过程中需要两次扫描事务集来建立FP树,这不仅降低了算法的效率,而且给数据库服务器带来负担。在原有经典FP-Growth算法的基础上,提出一种基于二维表的方法对原算法进行改进,改进算法通过使用二维向量记录频繁度仅需遍历一次事务集,从而省略FP-Growth算法在生成新条件FP树时对条件模式基的第一次遍历,大大缩短了建立FP树的时间。实验结果表明,该算法的改进优于经典算法。 The FP-Growth algorithm based on FP-Tree needs to set scanning twice transaction set to create FP tree in the process of mining frequent patters,which not only reduces the efficiency of the algorithm,but also brings a burden to the database server.A new algorithm based on two-dimensional table is presented which scans at most one for the transaction set to improve the original algorithm,greatly re-ducing the time for the establishment of FP tree.Experimental results show that the algorithm is superior to the classical algorithm.

作者杨云罗艳霞

机构地区陕西科技大学电气与信息工程学院莆田学院电子信息工程系

出处《计算机工程与设计》 CSCD 北大核心 2010年第7期1506-1509,共4页 Computer Engineering and Design

关键词数据挖掘关联规则频繁模式频繁项集 FP树 data mining association rule frequent patterns frequent item set FP tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1李志云,周国祥.一种基于MFP树的快速关联规则挖掘算法[J].计算机技术与发展,2007,17(6):94-96. 被引量：6
2徐前方,阚建杰,李永春,李荣盛,郭军.一种具有时序特征的告警关联规则挖掘算法[J].微电子学与计算机,2007,24(3):23-26. 被引量：6
3盛伟翔,龙佳丽.数据仓库与数据挖掘技术[J].电脑知识与技术,2007(8):631-632. 被引量：5
4宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
5秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
6陈义明,李舟军,傅自纲.基于FP-Tree的约束关联规则挖掘算法[J].计算机工程与设计,2007,28(18):4450-4453. 被引量：8
7赵孝敏,何松华,李贤鹏,尹波.一种改进的FP-Growth算法及其在业务关联中的应用[J].计算机应用,2008,28(9):2341-2344. 被引量：5
8范明,李川.在FP-树中挖掘频繁模式而不生成条件FP-树[J].计算机研究与发展,2003,40(8):1216-1222. 被引量：56
9李洪波,周莉,张吉赞.用垂直数据格式构建FP增长树的算法[J].计算机工程与应用,2009,45(8):161-164. 被引量：4

二级参考文献44

1周焕银,张永,蔺鹏.一种不产生候选项挖掘频繁项集的新算法[J].计算机工程与应用,2004,40(15):182-185. 被引量：14
2刘乃丽,李玉忱,马磊.一种基于FP-tree的最大频繁项目集挖掘算法[J].计算机应用,2005,25(5):998-1000. 被引量：8
3高俊,何守才.布尔型关联规则挖掘算法研究[J].计算机工程,2006,32(1):116-118. 被引量：5
4Han Jia-wei,Kamber M.Data mining concepts and techniques[M]. Beijing:Higher Education Press,2001.
5Witten I H,Frank E.Data mining practical machine learning tools and techniques[M].2nd ed.Beijing:China Machine Press,2005.
6[1]R Agrawal,R Srikant.Fast algorithms for mining association rules.In:J Bocca,M Jarke,C Zaniolo,eds.Proc of the 20th Int'l Conf on Very Large DataBases (VLDB'94).San Francisco:Morgan Kaufmann,1994.487-499
7[2]M Zaki,S Parthasarathy,M Ogihara,et al.New algorithms for fast discovery of association rules.In:D Heckerman,et al,eds.Proc of the 3rd Int'l Conf on Knowledge Discovery and Data Mining (KDD'97).Menlo Park,CA:AAAI Press,1997
8[3]J Han,J Pei,Y Yin.Mining frequent patterns without candidate generation.In:M Dunham,J Naughton,W Chen,eds.Proc of 2000 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'00).New York:ACM Press,2000.1-12
9[5]G Grahne,J Zhu.Efficiently using prefix-trees in mining frequent itemsets.First Workshop on Frequent Itemset Mining Implementation (FIMI'03),Melbourne,FL,2003
10[6]http://fuzzy.cs.uni-magdeburg.de/～borgelt/

共引文献243

1李泓冰.WTO的眉批:伤脑筋的道德成本[J].理论参考,2002(S1):46-46.
2秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
3谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
4蔡高明.一种快速挖掘模糊频繁项集的方法[J].科技经济市场,2008(3):5-6.
5姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
6杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
7庄蔚蔚,姜青山.恶意软件鉴别技术及其应用[J].集成技术,2012,1(1):55-64. 被引量：3
8王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
9丁欣,马严,吴军.适用于校园网的视频推荐系统的设计与实现[J].通信学报,2013,34(S2):175-179. 被引量：4
10朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.

同被引文献336

1任风英,鲍婷婷,王博深,李跃华.基于中医传承辅助平台分析李跃华治疗慢性脑供血不足气虚血瘀证的用药规律[J].辽宁中医杂志,2020(10):128-132. 被引量：6
2李存荣,张开敏,杨明忠.关联知识规则在产品质量控制中的应用[J].仪器仪表学报,2004,25(z1):966-968. 被引量：2
3秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
4章志刚,吉根林.基于迭代式MapReduce的Apriori算法设计与实现[J].华中科技大学学报（自然科学版）,2012,40(S1):9-12. 被引量：8
5杨霁琳.一种基于概念格的规则提取方法及其应用[J].计算机科学,2012,39(S3):204-206. 被引量：2
6姚幸,韩建民.西北牧区经济发展与草地退化的关系[J].草业科学,2015,32(4):628-634. 被引量：12
7施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
8潘有能,邓三鸿.基于XML和关联规则的Web挖掘研究[J].现代图书情报技术,2004(7):30-34. 被引量：9
9鞠平,戴琦,黄永皓,付红军,何南强.我国电力负荷建模工作的若干建议[J].电力系统自动化,2004,28(16):8-12. 被引量：35
10王飞,孙莹.配电网故障定位的改进矩阵算法[J].电力系统自动化,2003,27(24):45-46. 被引量：89

引证文献25

1刘红婷,程琦峰,杨雪梅.基于FP-growth算法的高校招生就业决策分析系统研究与设计[J].科技广场,2011(11):60-64. 被引量：1
2张爱科,符保龙.基于高维聚类的探索性文本挖掘算法[J].计算机应用,2013,33(4):988-990. 被引量：4
3江雨燕,李平.基于PFP-Growth算法的海量频繁项集挖掘[J].计算机技术与发展,2013,23(9):63-65. 被引量：2
4温海波.基于项对索引链表的优化FP-Growth算法[J].哈尔滨师范大学自然科学学报,2013,29(4):55-59.
5宋楚平.一种用于FTTx网络规划的频繁序列挖掘算法FSM+[J].重庆邮电大学学报（自然科学版）,2014,26(2):280-284.
6槐向兵,厉征鑫,刘建立,高卫东.基于轮廓波变换的织物疵点分割[J].计算机工程与设计,2014,35(6):2153-2158. 被引量：6
7叶福兰.基于FP_tree的最大频繁模式挖掘算法的改进[J].成都大学学报（自然科学版）,2014,33(2):148-150. 被引量：4
8谢霖铨,章恩.以互信息为度量的一种规则可视化[J].计算机工程与应用,2014,50(17):146-149.
9曹军威,袁仲达,明阳阳,张华赢.能源互联网大数据分析技术综述[J].南方电网技术,2015,9(11):1-12. 被引量：66
10汪峰坤,张婷婷.一种基于有向图的多维多值属性关联规则挖掘算法[J].宿州学院学报,2015,30(12):99-101. 被引量：1

二级引证文献171

1常凤,刘静,包浕,冯婷,胡忠旭.关联规则在乡村超市销售中的应用研究[J].昭通学院学报,2023,45(5):8-12.
2王申,麻超,吴家敬,冯凯军.地铁工程智能用电及能耗控制综合评价体系研究[J].中国水运（下半月）,2023,23(11):40-42.
3王思.应用属性约简算法实现运动员伤病影响因素评估的研究[J].电子测量技术,2020,43(11):10-15.
4周云红,黄飞,王玉莹.物联塑壳断路器的拓扑识别模块设计[J].电器与能效管理技术,2022(12):38-45. 被引量：2
5刘春贵,赵筱蓉.PLC控制在高压系统中的应用[J].四川冶金,2000,22(2):57-59.
6于海鹏,翟红生.一种子空间聚类算法在多标签文本分类中应用[J].计算机应用与软件,2014,31(8):288-291. 被引量：4
7武健.时序Web数据挖掘方法[J].计算机应用,2014,34(A02):120-122. 被引量：1
8梁凤兰.文本挖掘中一种基于参数估计的语句分块方案研究[J].计算机应用研究,2015,32(4):986-991. 被引量：1
9杨龙光,吴晶妹.基于统计的聚类模型构建研究[J].统计与决策,2015,31(17):28-31. 被引量：1
10郑一露,申梦绮.基于机器视觉的白胚布疵点检测方法综述[J].信息技术与信息化,2015(8):163-165.

1孔晓光,郭金玉,林爱军.基于二维主元分析的间歇过程故障诊断[J].计算机应用,2013,33(2):350-352. 被引量：2
2汪成亮,罗昌银.一种基于组合方式改进的频繁项集挖掘算法[J].计算机系统应用,2010,19(1):67-71. 被引量：3
3王春风,周宁.数据挖掘算法的改进及其在Chord网络中的应用[J].计算机应用,2012,32(1):199-201. 被引量：2
4郑斌.基于SQL技术的频繁模式的发掘[J].中原工学院学报,2008,19(5):56-60.
5陈舒娅,戴云武.Flash中的二维向量实现[J].科技广场,2010(8):83-85.
6林丽,冯少荣,薛永生.基于有限个条件FP_树中挖掘频繁模式[J].计算机工程与应用,2007,43(5):175-177.
7王景中,任虎.一种改进的FP_growth算法[J].网络安全技术与应用,2010(7):79-81.
8杨鹏坤,彭慧,周晓锋,孙玉庆.改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J].计算机应用,2015,35(3):775-778. 被引量：16
9李金忠,梁正友.一种引入索引加速挖掘关联规则的高效算法[J].计算机工程与科学,2009,31(4):69-71.
10罗芳.一种基于裁剪FP-Tree的频繁项集挖掘算法[J].宜春学院学报,2015,37(12):22-25. 被引量：1

计算机工程与设计

2010年第7期

浏览历史

内容加载中请稍等...

FP-Growth算法的改进被引量：25

参考文献9

二级参考文献44

共引文献243

同被引文献336

引证文献25

二级引证文献171

相关作者

相关机构

相关主题

浏览历史

FP-Growth算法的改进 被引量：25

参考文献9

二级参考文献44

共引文献243

同被引文献336

引证文献25

二级引证文献171

相关作者

相关机构

相关主题

浏览历史

FP-Growth算法的改进被引量：25