一种适应大型数据库的多支持度关联规则算法被引量：1

New algorithm for mining association rules with multiple supports in large databases

下载PDF

导出

摘要关联规则挖掘一直是数据挖掘中的重要组成部分。提出一个新算法DPCFP-growth算法。DPCFP-growth算法是基于MSApirori算法,采用了CFP-growth分而治之的思想,并弥补了CFP-growth算法的不足。CFP-growth算法运行时要把整个数据库中的数据压缩到一个MIS-tree中然后进行频繁模式挖掘。在大型数据库中CFP-growth算法会建立一个深度很深宽度很宽的CFP-tree,以至于内存往往不能满足其要求,被迫使用大量的辅存,致使算法的运行效率急剧下降。DPCFP-growth算法根据CFP-tree的特征,有效地把大数据库分为若干个内存可以满足其要求的子数据库,然后在每个子数据库中进行局部频繁模式挖掘,最终汇总这些频繁模式生成全局频繁模式。实验表明该算法是正确的,并且在大型数据挖掘中,比CFP-growth算法有一定的优越性。 Mining association rules from a large database have been described as an important problem of database mining.In this paper,a novel algorithm DPCFP-growth is proposes.The algorithm based upon the MSApirori takes advantage of the advantage and offsets the disadvantage of CFP-growth that CFP-growth always needs so much EMS memory in large database that the computer can＇t meet it.In DPCFP-growth algorithm,according to characters of MIS-tree,firstly partition a large database into some smaller databases which EMS memory of computer can meet them.Secondly the algorithm takes in the thinking of the CFPgrowth to mining local frequent patterns.Finally ,the algorithm parses the set of all the local frequent patterns to get final frequent patterns.The experiments show that the DPCFP-growth algorithm has more superiority to previous algorithm.

作者薛永庆徐维祥

机构地区北京交通大学交通运输学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第2期182-185,共4页 Computer Engineering and Applications

基金北京市教委科技发展重点项目(No.KZ200710028014)。

关键词数据挖掘数据库划分多支持度频繁模式 data mining database partition multiple minimum supports frequent pattern

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1Han J,Kamber M.Data mining:concepts and techniques[M].Beijing:High Education Press,2001.
2Tseng Ming-Cheng,Lin Wen-Yang.An efficient mining of generalized association rules with non-uniform minimum support[J].Data & Knowledge Engineering,2007,62:41-64.
3Lee Y C,Hong T P,Lin Wen-yang.Mining association rules with multiple minimum supports using maximum constraints[J].International Journal of Approximate Reasoning,2005,40:44-54.
4Liu Bing,Hsu W,Ma Yi-ming.Mining association rules with multiple minimum supports[C]//ACM SIGKDD International Conference on Knowledge Discovery& Data Mining(KDD-99),San Diego,CA,USA,August 1999:15-18.
5Hu Ya-han,Chen Yen-liang.Mining association rules with multiple minimum supports a new mining algorithm and a support tuning mechanism[J].Decision Support Systems,2006,42:1-24.
6郑泉,王建东.基于FP-树挖掘大数据库的方法及算法PCM[J].计算机工程与应用,2004,40(7):182-184. 被引量：6
7Savasere A,Omiecinski E,Navathe S.An efficient algorithm for mining association rules in large databases[C]//Proceedings of the 21st VLDB Conference Zurich,Swizerland,1995:432-444.
8Agrawal R,Srikant R.Fast algorithms for mining association rules[C]//Proceedings of the 20th Very Large DataBases Conference(VLDB'94),Santiago de Chile,Chile,1994:487-499.
9Stonebraker M,Agrawal R,Dayal U,et al.Database research at a crossroads:the vienna update[C]//Proceedings of the 19th International Conference on Very Large Data Bases,Dublin Ireland,August 1993:688-192.
10Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C]//Proceedings of the ACM SIGMOD Conference on Management of data,May 1993:207 -216.

二级参考文献4

1[1]Jiawei Han,Micheline Kamber. Data Mining:Concepts and Techniques.CopyrightC2001 by Morgan Kaufmann Publishers,Inc
2[2]R Agrawal ,R Srikant. Fast algorithms for mining association rules[C].In:Proc 1994 Int Conf Very Large Data Bases(VLDB'94),Santiago,Chile, 1994-09
3[3]J Han,J Pei,Y Yin. Mining frequent patterns without candidate generation[C].In:Pro 2000 ACM-SIGMOD Int Conf Management of Data(SIGMOD'00), Dallas ,TX ,2000-05:1～12
4[4]R Agarwal,C Aggarwal,V V V Prasad. A tree projection algorithm for generation of frequent itemsets. In J Parallel and Distribute Computing, 2000

共引文献5

1崔建,李强,王国师.一种针对大型事务数据库的关联规则挖掘算法[J].空军雷达学院学报,2011,25(3):205-208. 被引量：2
2王勇,邹盛荣.基于特征模糊贴近的数据库约束挖掘算法[J].计算机科学,2013,40(11):208-210.
3刘华,张亚昕.基于FP-tree算法的推荐系统设计与实现[J].电子设计工程,2015,23(2):81-83. 被引量：3
4刘华.FP-tree关联规则算法在推荐系统中的应用[J].信息技术,2015,39(11):185-188. 被引量：1
5刘华.FP—tree关联规则算法在推荐系统中的应用[J].西安铁路职业技术学院学报,2015,0(4):1-5.

同被引文献10

1崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
2李玉荣,杨树强,贾焰,周斌,樊宇.分布式日志服务关键技术研究[J].计算机工程与应用,2006,42(7):116-118. 被引量：5
3钟武,胡守仁.一种分布式数据库查询优化算法[J].计算机学报,1997,20(11):1024-1033. 被引量：10
4韦勇,连一峰.基于日志审计与性能修正算法的网络安全态势评估模型[J].计算机学报,2009,32(4):763-772. 被引量：97
5申利民,张旭晖.面向SAAS模式的日志架构设计与实现[J].计算机应用与软件,2011,28(12):57-59. 被引量：1
6刘虎球,马超,白家驹.面向驱动配置的自动日志插入方法研究[J].计算机学报,2013,36(10):1982-1992. 被引量：2
7付博,赵世奇,刘挺.Web查询日志研究综述[J].电子学报,2013,41(9):1800-1808. 被引量：8
8周江,王伟平,孟丹,马灿,古晓艳,蒋杰.面向大数据分析的分布式文件系统关键技术[J].计算机研究与发展,2014,51(2):382-394. 被引量：75
9宛婉,周国祥.Hadoop平台的海量数据并行随机抽样[J].计算机工程与应用,2014,50(20):115-118. 被引量：11
10廖湘科,李姗姗,董威,贾周阳,刘晓东,周书林.大规模软件系统日志研究综述[J].软件学报,2016,27(8):1934-1947. 被引量：37

引证文献1

1张骁,应时,张韬.应用软件运行日志的收集与服务处理框架[J].计算机工程与应用,2018,54(10):81-89. 被引量：14

二级引证文献14

1刘磊,孙路强,周利霞,许贺.基于Syslog的网络日志管理平台[J].电子技术与软件工程,2019(5):12-14. 被引量：4
2丁月林.嵌入式软件中的错误追踪机制[J].电子技术与软件工程,2019(2):175-175.
3杨琴,刘刚.基于日志分析的网络性能检测分析平台设计与应用[J].重庆理工大学学报（自然科学）,2019,33(8):165-169.
4余铮,冯浩,查志勇.集成电力大数据日志分析模块的信息系统研究[J].计算机与数字工程,2020,48(3):571-574. 被引量：4
5闫四洋,胡昌平,卞德志,左刚.基于SpringBoot+MongoDB的微服务日志系统的实现[J].计算机时代,2020(8):69-71. 被引量：7
6范龙,王川,邓玉芬,刘传勇,姚俊杰,李强.海洋调查测量信息系统(二):应用软件[J].海洋测绘,2020,40(4):72-76.
7贾周阳,李姗姗,刘晓东,王戟,廖湘科.意图敏感的日志自动增强[J].中国科学：信息科学,2020,50(11):1612-1628. 被引量：1
8赵洁.Syslog在发射台站网络安全管理中的应用[J].广播电视信息,2020,27(8):70-72. 被引量：2
9王璐,李青山,吕文琪,张河,李昊.基于事件关系保障识别质量的自适应分析方法[J].软件学报,2021,32(7):1978-1998. 被引量：4
10郭向民,梁广俊,夏玲玲.基于HMM的Domain-Flux恶意域名检测及分析[J].信息网络安全,2021(12):1-8. 被引量：5

1李婷,张继周.基于分区的关联规则Apriori算法研究[J].科技视界,2015(28):28-28.
2叶飞跃,王建东,庄毅,吕宗磊.一种挖掘频繁模式的数据库划分新方法[J].系统工程与电子技术,2004,26(11):1666-1668. 被引量：3
3伊卫国,卫金茂,王名扬,王兴通.基于数据库划分的高效关联规则挖掘算法研究[J].东北师大学报（自然科学版）,2004,36(4):45-50. 被引量：7
4徐久成,董婉,王煜尧.基于多粒度划分的图像语义检索方法[J].小型微型计算机系统,2017,38(5):1091-1097. 被引量：1
5黄学平,薛安荣.基于数据库划分的关联规则算法[J].计算机工程与设计,2008,29(12):3005-3007. 被引量：5
6阮幼林,李庆华,刘干.分布环境中的并行频繁模式挖掘算法[J].计算机工程与应用,2005,41(25):1-3. 被引量：3
7于德乾,于晓波.浅谈建立局部网络的几个问题[J].情报学刊,1990,11(3):199-204. 被引量：2
8张宁.基于FP-tree的Apriori算法的改进[J].信息通信,2015,28(2):94-95. 被引量：4
9伊卫国,赵波.基于决策属性的关联规则挖掘[J].大连交通大学学报,2007,28(1):62-65. 被引量：3
10王友升.城市三维地质空间数据库建库设计方案[J].计算机工程与设计,2007,28(5):1176-1178. 被引量：5

计算机工程与应用

2008年第2期

浏览历史

内容加载中请稍等...

一种适应大型数据库的多支持度关联规则算法被引量：1

参考文献12

二级参考文献4

共引文献5

同被引文献10

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种适应大型数据库的多支持度关联规则算法 被引量：1

参考文献12

二级参考文献4

共引文献5

同被引文献10

引证文献1

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种适应大型数据库的多支持度关联规则算法被引量：1