基于FP-tree挖掘密集型数据最大频繁模式算法被引量：2

An Algorithm for Mining Maximal Frequent Patterns of Dense Datasets Based on Fp-tree

下载PDF

导出

摘要 Fp-growth算法是当前挖掘频繁项目集算法中速度最快,应用最广,并且不需要候选集的一种挖掘关联规则的算法．但是,Fp-growth算法也存在着算法结构复杂和空间利用率低等缺点．在FP-tree结构的基础上提出了密集型数据最大频繁模式挖掘算法FP-DMax．算法FP-DMax只需要2次扫描数据库,在挖掘过程中不产生候选项集,大大提高了算法的时空效率．实验表明,算法FP-DMax在挖掘密集型数据最大频繁模式方面是高效的． Fp-growth algorithm is one of the currently fastest and most popular one for mining association rule without candidate generation. However, it has disadvantages such as complicated data structure and lower space utilization rate. This paper develops the algorithm FP-DMax for mining maximal frequent patterns of dense datasets based on the data structure FP-tree. The algorithm only scans the database twice and generates no candidate itemsets. The experiment shows that the algorithm FP-DMax is efficient on mining dense datasets.

作者易月娥林亚平王永红

机构地区湖南大学软件学院湖南城市学院计算机系

出处《湖南城市学院学报（自然科学版）》 CAS 2007年第1期76-78,共3页 Journal of Hunan City University:Natural Science

基金湖南省自然科学基金资助项目(06JJ2050)

关键词数据挖掘关联规则最大频繁模式 FP—tree Data mining association rule maximal frequent patterns FP-tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large database[C].Peter Buneman,Sushil Jajodia Proceedings of SIGMID'93,Washington D C:ACMPress,1993:207-216.
2Han J,Kambe M.Data Mining:Concepts and Techniques[M].San Francisco:Morgaan Kaufmann Publishers,2001.
3Han J,Pei J,Yin Y.Mining Frequent Patterns Without CandidateGeneration[C].In Proc 2000 ACM-SIGMOD Int Conf Management of Data (SIGMOD'00),Dalas,TX,2000,5:1-12
4Pei J.Pattern Growth Methods for Frequent Pattern Mining[D].Simon Fraser University,2002-06-13
5Burdick D,Calimlim M,Gehrke J.MAFIA:A Maximal FrequentItemset Algorithm for Transactional Databases[C].In Int'l Conf on Data Engineering,2001.

同被引文献14

1杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
2秦亮曦,李谦,史忠植.基于排序FP-树的频繁模式高效挖掘算法[J].计算机科学,2005,32(4):31-33. 被引量：13
3Agrawai R, Imielinaki T, Swami A. Mining Associa- tion Rules Between Sets of Items in Large Databases [C]//Proc. of ACM SIGMOD Conference on Manage ment of Data. Washington D. C. , USA.. ACM Press, 1993.
4HAN Jiawei, PEI Jian, YIN Yiwen. Mining frequent patterns without candidate generation., a frequent-pat- tern tree approach [J]. Data Mining and Knowledge Discovery, 2004,8(1) : 53-87.
5Grahne G, Zhu J K High performance mining of maxi- mal frequent itemsets[C]//Proeeedings of the 6th SI- AM International Work-shop on High Performance, 2003 : 135-143.
6Han J, Pei J, Yin Y. Mining frequent patterns with- out candidate generation[C]//Proceedings of the 2000 ACMSIGMOD International Conference on Manage- ment of Data(SIGMOD'2000). Dallas,2000:1-12.
7王萍,张际平.云计算与网络学习[J].现代教育技术,2008,18(11):81-84. 被引量：158
8蒋翠清,胡俊妍.基于FP-tree的最大频繁项集挖掘算法[J].合肥工业大学学报（自然科学版）,2010,33(9):1387-1391. 被引量：4
9杨志豪,赵太银,姚兴苗,李磊.一种适应数据与计算密集型任务的私有云系统实现研究[J].计算机应用研究,2011,28(2):621-624. 被引量：18
10王娟勤,李书琴.基于矩阵的关联规则挖掘算法研究与改进[J].计算机测量与控制,2011,19(9):2275-2277. 被引量：5

引证文献2

1纪怀猛.基于改进FP-Tree的最大频繁项集高效挖掘算法[J].计算机与数字工程,2014,42(6):959-963. 被引量：3
2边文静.基于聚类算法的大数据中密集数据算法分析[J].信息技术与信息化,2021(4):222-224. 被引量：1

二级引证文献4

1字云飞,李业丽,孙华艳,张莉婧.改进FP-Growth算法在旅游线路规划中的应用研究[J].计算机与现代化,2018(2):17-21. 被引量：4
2刘慧婷,候明利,赵鹏,姚晟.不确定数据流最大频繁项集挖掘算法研究[J].计算机工程与应用,2016,52(19):72-77. 被引量：9
3王利军,唐立.基于有序FP-tree结构和二维表的最大频繁模式挖掘算法[J].韶关学院学报,2019,40(9):21-25.
4李志伟,侯敏杰.基于滑动窗口的混合属性大数据聚类算法[J].信息与电脑,2024,36(5):49-52.

1梁艳春,王在申.人工神经网络BP算法密集型数据的预处理[J].吉林大学自然科学学报,1995(3):19-22. 被引量：15
2谭琳.大数据技术初探[J].科技创新导报,2014,11(4):48-48. 被引量：6
3朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
4孟祥萍,钱进,张维俊.基于候选最大频繁项目集的关联规则挖掘算法[J].长春工程学院学报（自然科学版）,2003,4(1):1-4. 被引量：3
5冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18
6陈红霞.基于密集型数据复写的复杂项目增长趋势检测[J].科技通报,2015,31(10):52-54.
7宁慧,王素红,崔立刚,郭笑语,徐丽.基于改进的FP-tree最大频繁模式挖掘算法[J].应用科技,2016,43(2):37-43. 被引量：4
8崔蒙,李海燕,雷蕾,胡雪琴.“大数据”时代与中医药“知识密集型”数据[J].中国中医药图书情报杂志,2013(3). 被引量：17
9马迪,陈琦,于智娟.面向高性能计算机的海量数据处理平台实现与评测[J].网友世界,2014,0(23):9-9.
10马丽生.快速挖掘频繁项目集算法[J].计算机工程与设计,2009,30(8):1903-1906. 被引量：6

湖南城市学院学报（自然科学版）

2007年第1期

浏览历史

内容加载中请稍等...

基于FP-tree挖掘密集型数据最大频繁模式算法被引量：2

参考文献5

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于FP-tree挖掘密集型数据最大频繁模式算法 被引量：2

参考文献5

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于FP-tree挖掘密集型数据最大频繁模式算法被引量：2