一种基于F-矩阵的最大频繁项目集快速挖掘算法被引量：1

A Fast Mining Algoritm of Maximum Frequent Itemsets Based on F-matrix

下载PDF

导出

摘要最大频繁项目集挖掘是多种数据挖掘应用研究的一个重要方面,最大频繁项目集的快速挖掘算法研究是当前研究的热点。传统的最大频繁项目集挖掘算法要多遍扫描数据库并产生大量的候选项目集。为此,该文提出了基于F-矩阵的最大频繁项目集快速挖掘算法FMMFIBFM,FMMFIBFM采用FP-tree的存储结构,仅须扫描数据库两遍且不产生候选频繁项目集,有效地提高了频繁项目集的挖掘效率。实验结果表明,FMMFIBFM算法是有效可行的。 Mining maximum frequent itemsets is a major aspect of data mining researches.Efficient mining algorithm research of maximum frequent itemsets is the key problem.Conventional algorithms of maximum frequent itemsets need generate a lots of candidate sets,and need repeatedly scan the database,especially when there exist prolific patterns and or long patterns.In order to overcome the drawbacks of traditional mining algorithms,in this paper,the authors introduce algorithm FMMFIBF (fast mining maximum frequent itemsets based on F-matrix) ,FMMFIBF only scan database twice by using FP-tree structure,and need not to generate any candidate itemsets,so mining efficiency of maximum frequent itemsets is obviously improved.Experimental result shows that FMMFIBF algorithm is effective and efficient.

作者杨萍

机构地区安徽工程科技学院数理系

出处《计算机工程与应用》 CSCD 北大核心 2003年第34期197-200,共4页 Computer Engineering and Applications

基金安徽省自然科学基金(编号:03042205) 安徽省教育厅自然科学研究基金(编号:2003kj029)

关键词数据挖掘频繁模式树频繁项目集关联规则最大频繁项目集 Data Mining,Frequent Pattern tree,Frequent Itemsets,Association Rules,Maximum Frequent Itemsets

分类号 TP182 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1张朝晖,陆玉昌,张钹.发掘多值属性的关联规则[J].软件学报,1998,9(11):801-805. 被引量：61
2杨明,孙志挥,赵传申.交易数据库的加权关联规则增量更新算法[J].计算机工程与应用,2002,38(1):71-73. 被引量：6
3路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
4杨萍,宋振超.FP-growth算法的一种改进[J].安徽工程科技学院学报（自然科学版）,2002,17(3):8-13. 被引量：1

二级参考文献20

1Brin S,Motwanti R,Ullman J et al. Dynamic itemset counting and implication rules for market basket data[C].In:Proceedings of the Intemational Conference on Management of Data,1997:255～264
2Brin S,Motwanti R,Silverstein C.Beyond market baskets:generalizing association rules to correlations[C].In:Proceedings of the ACM SIG MOD international Conference on Management of Data,1997:265～276
3Agrawal R,ImielinSki T,Swami A.Mining association rules between sets of items in large database[C].Proceeding of the ACM SIGMOD International Conference on Management of Data, 1993:207～216
4Agrawal R,Srikant R.Fast algorithm for mining association rules[C].In :Proceedings of the 1994 International Conference on Very Large Data Bases,Santiago,Chile: 1994:487～499
5张朝晖，Proceedings of PAKDD，1997年
6Cheung D，IEEE Trans Knowl Data Eng，1996年，8卷，6期，911页
7Han J，IEEE Trans Knowl Data Eng，1996年，8卷，3期，373页
8Lin Dao I，Proc the 6th European Conference on Extending Database Technology，1998年，105页
9Agrawal R，Proc the 11th Inter Conference on Data Engineering，1995年，3页
10Agrawal R, ImielinSki T, Swami A. Mining association rules between sets of items in large database[A]. Proceeding of the ACM SIGMOD international Conference on Management of Data, 1993,(2):207- 216

共引文献176

1秦玉华,于秀珍.基于关联规则的智能答疑研究与实现[J].计算机产品与流通,2020,0(4):211-211.
2谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
3姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
4袁隽媛.基于粗糙集的高校资产数据挖掘研究[J].计算机工程,2011,37(S1):46-48. 被引量：1
5陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2
6马光志,张爱芳,刘玉亮.一种基于网格几何性质的数量关联规则聚类算法[J].计算机工程,2004,30(11):121-122. 被引量：1
7杨君锐.逆向启发式开采最大频繁项目集[J].计算机工程,2004,30(14):116-118. 被引量：1
8吴顺祥,刘思峰,辜建德.基于粗集理论的一种规则提取方法[J].厦门大学学报（自然科学版）,2004,43(5):604-608. 被引量：8
9杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
10伊卫国,卫金茂,王名扬.基于项目集加权的增量关联规则算法研究[J].计算机工程与应用,2004,40(34):192-194. 被引量：1

同被引文献5

1颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：68
2Agrawal R,Srikant R.Fast algorithms for mining association rules[C].In:Proc of the 20th lnt'l Conf on Very Large Databases(VLDB'94),Santiago:Morgan Kaufmann,1994:487-499[EB/OL].http://www.almaden.ibm.com/cs/people/srikant/papers/vldb94.pdf.
3J Han,J Pei and Y Yin.Mining Frequent Patterns without Candidate Generation:A Frequent-Pattern Tree Approach Mining Frequent Patterns without Candidate Generation[J].Data Mining and Knowledge Discovery,2004,8:53-87.
4Grahne G,Zhu J.Efficiently using prefix-trees in mining frequent itemsets[C].In:1st Workshop on Frequent Itemset Mining Implementation(FIMI'03),2003.
5方炜炜,杨炳儒,宋威,侯伟.基于布尔矩阵的关联规则算法研究[J].计算机应用研究,2008,25(7):1964-1966. 被引量：18

引证文献1

1彭慧伶,舒云星,武新.基于FP-tree的最大频繁项集挖掘新算法[J].计算技术与自动化,2009,28(2):62-65.

1冯洁,陶宏才.一种频繁项集的快速挖掘算法[J].微计算机信息,2007(18):164-166. 被引量：7
2王扶东,李兵,薛劲松,朱云龙.客户关系管理中基于约束的关联规则挖掘方法研究[J].计算机集成制造系统-CIMS,2004,10(4):465-470. 被引量：7
3丁卫平,祁恒,董建成,管致锦.基于关联规则的电子病历挖掘算法研究与应用[J].微电子学与计算机,2007,24(3):69-73. 被引量：19
4裴古英.一种基于布尔矩阵的关联规则快速挖掘算法[J].自动化与仪器仪表,2009(5):16-18. 被引量：2
5许普乐,纪允,张勤.应用FP树快速生成无关集算法[J].安庆师范学院学报（自然科学版）,2016,22(2):60-65. 被引量：1
6杨君锐.一种频繁项目集的快速挖掘算法[J].微电子学与计算机,2004,21(2):70-72. 被引量：2
7胡慧蓉,王周敬.一种基于关系矩阵的关联规则快速挖掘算法[J].计算机应用,2005,25(7):1577-1579. 被引量：21
8郭景峰,路燕.基于小超集的关联规则快速挖掘算法[J].计算机工程,2000,26(12):40-41. 被引量：1
9安立奎,钱伟懿,韩丽艳.集群系统中基于MPI的关联规则快速挖掘算法[J].三峡大学学报（自然科学版）,2010,32(1):95-97. 被引量：5
10杨萍,宋振超.FP-growth算法的一种改进[J].安徽工程科技学院学报（自然科学版）,2002,17(3):8-13. 被引量：1

计算机工程与应用

2003年第34期

浏览历史

内容加载中请稍等...

一种基于F-矩阵的最大频繁项目集快速挖掘算法被引量：1

参考文献4

二级参考文献20

共引文献176

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于F-矩阵的最大频繁项目集快速挖掘算法 被引量：1

参考文献4

二级参考文献20

共引文献176

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于F-矩阵的最大频繁项目集快速挖掘算法被引量：1