在单向FP-tree上挖掘最大频繁项集被引量：1

Mining Maximal Frequent Itemsets in a Unidirectional FP-tree

下载PDF

导出

摘要针对稠密数据集,提出一种基于单向FP-tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算最大频繁项集的弊端,极大的降低了内存空间和时间开销,提高了挖掘效率。实验表明,与FP-Max算法相比,算法的效率提高了1倍以上。 Proposes an efficient algorithm Unid_FP-Max2 for mining the complete set of maximal frequent itemsets in a unidirectional FP-tree. Because the algorithm only generates constrained sub-trees which is pseudo tree structure consisting of three small arrays based on the originally unidirectional FP-tree, avoides the flaw in former algorithms which need to generate lots of conditional FP-trees for finding maximal frequent itemsets recursively. Reduces the space and time consumption to a great extent,then the algorithm improves mining efficiency. Experiment shows that in comparison with FP-Max, this algorithm accelerates the mining speed by at least one times.

作者宋晶晶姜保庆关丽霞

机构地区清远职业技术学院河南大学数据与知识工程研究所

出处《现代计算机》 2010年第1期19-24,共6页 Modern Computer

基金河南省高校杰出科研人才创新工程项目(No2007KYCX018)

关键词数据挖掘频繁项集最大频繁项集单向FP—tree 被约束子树 Data Mining Frequent Itemset Maximal Frequent Itemset Unidirectional FP-tree Constrained Sub-Tree

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献18

1R Agrawal,R Srikant. Fast Algorithms for Mining Association Rules. In: Proc. of 1994 Int'l Conf. on Very Large Data Bases. Santiago, Chili : VLDB Endowment[C]. 1994:487-499.
2J S Park,M S Chen,P S Yu. An Effective Hash-Based Algorithm for Mining Association Rules. In: Proc. of 1995 ACMSIGMOD Int'l Conf. on Management of Data. San Jose ,CA : ACM Press [C]. 1995:175-186.
3R Agrawal , R Srikant. Mining Sequential Patterns. In : ICDE' 951 Taipei,Taiwan: IEEE Computer Society Press [C]. 1995: 3-14.
4S. Brin,R. Motwani, C. Silverstein. Beyond Market Basket Generalizing Association Rules to Correlations. In SIGMOD[C] 1997:265-276.
5Bayardo R. Efficiently Mining Long Patterns from Databases. In: Haas LM,ed. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. New York: ACM Press[C].1998:85-93.
6Lin D,Kedem ZM. Pincer-Search: A New Algorithm for Discovering the Maximum Frequent Set. In: Proc. of the 6th European Conf. on Extending Database Technology[C]. Heidelberg: Springer-Verlag, 1998:105-119.
7路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
8宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
9Burdick D, Calimlim M, Gehrke J. Mafia: A Maximal Frequent hemset Algorithm for Transactional Databases. in: Proc. of the 17th Int'l Conf. on Data Engineering[C], 2001:443-452.
10Gouda K,Zaki MJ. Efficiently Mining Maximal Frequent hemsets. In: Proc. of the 1st IEEE Int'l Conf. on Data Mining, 2001:163-170.

二级参考文献16

1颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：68
2R Agrawal, R Srikant. Fast algorithms for mining association rules. In: Proc of 1994 Int'l Conf on Very Large Data Bases.Santiago, Chili: VLDB Endowment, 1994. 487--499.
3J S Park, M S Chen, P S Yu. An effective Hash-based algorithm for mining association rules. In: Proc of 1995 ACM-SIGMOD Int'l Cord on Management of Data. San Jose, CA: ACM Press,1995. 175--186.
4S Brin, R Motwani, C Silvemtein. Beyond market basket:Generalizing association rules to correlations. In: Proe of 1997 ACM-SIGMOD Int'l Conf on Management of Data. Tucson, AZ:ACM Press, 1997. 265--276.
5R Agrawal, R Srikant. Mining sequential patterns. In: ICDE'95. Taipei, Taiwan: IEEE Computer Society Press, 1995. 3--14.
6G Dong, J Li. Efficient mining of emerging patterns: Discovering trends and differences. In: Proc of the 5th ACM SIGKDD Int'l Conf on Knowledge Discovery and Data Mining. San Diego, CA:ACM Press, 1999. 43~52.
7J Han, J Pei, Y Yin. Mining frequent patterns without candidate generation. In: Proe of 2000 ACM-SIGMOD Int'l Conf on Management of Data. Dallas, TX: ACM Press, 2000. 1--12.
8Artur Bykowski, Christophe Rigotti. A eondemsed representation to find frequent patterns. In: Proe of the 20th ACM SIGACT-SIGMOD-SIGART Symp on Principles of Database Systems(PODS 2001). Santa Barbara, CA: ACM Press, 2001. 267~273.
9Lin Dao I，Proc the 6th European Conference on Extending Database Technology，1998年，105页
10Agrawal R，Proc the 11th Inter Conference on Data Engineering，1995年，3页

共引文献263

1李泓冰.WTO的眉批:伤脑筋的道德成本[J].理论参考,2002(S1):46-46.
2秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
3谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
4蔡高明.一种快速挖掘模糊频繁项集的方法[J].科技经济市场,2008(3):5-6.
5姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
6杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
7庄蔚蔚,姜青山.恶意软件鉴别技术及其应用[J].集成技术,2012,1(1):55-64. 被引量：3
8王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
9丁欣,马严,吴军.适用于校园网的视频推荐系统的设计与实现[J].通信学报,2013,34(S2):175-179. 被引量：4
10陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2

同被引文献7

1阮幼林,李庆华,杨世达.一种基于事务树的快速频繁项集挖掘与更新算法[J].计算机科学,2005,32(2):210-212. 被引量：3
2崔海莉,袁兆山.一种快速发现最大频繁项集的挖掘算法[J].合肥工业大学学报（自然科学版）,2006,29(11):1392-1395. 被引量：4
3王黎明,赵辉.基于FP树的全局最大频繁项集挖掘算法[J].计算机研究与发展,2007,44(3):445-451. 被引量：16
4piangwen Han, Micheline Kamber, Jian Pei. Data Mining Concepts and Techniques Third Edition[M].北足:机械工业出版社,2012.7.
5张忠平,郑为夷.基于事务树的最大频繁项集挖掘算法[J].计算机工程,2009,35(15):97-99. 被引量：7
6任永功,张亮,付玉.一种基于频繁模式树的最大频繁项目集挖掘算法[J].小型微型计算机系统,2010,31(2):317-321. 被引量：6
7何波.基于FP-tree的快速挖掘全局最大频繁项集算法[J].计算机集成制造系统,2011,17(7):1547-1552. 被引量：2

引证文献1

1石芹芹.基于FP树的极大频繁项集的挖掘方法[J].现代计算机,2015,21(24):7-10. 被引量：2

二级引证文献2

1刘云翔,韩贝.基于改进FP算法的隧道交通事故关联分析[J].现代电子技术,2018,41(17):141-144. 被引量：10
2刘玥波,徐田翔,徐国庆.改进的FP-Growth算法在个性化推荐中的应用研究[J].软件,2021,42(8):45-47. 被引量：1

1王现君,宋晶晶,姜保庆.在单向FP-tree上挖掘频繁闭项集[J].计算机工程与应用,2008,44(10):150-153. 被引量：4
2孟志忠.基于改进的FP-树和数组技术的频繁模式挖掘算法[J].电脑开发与应用,2012,25(9):43-45.
3代月明,朱习军,刘连玉.基于集体度一置信度的关联规则挖掘[J].青岛建筑工程学院学报,2005,26(2):74-77. 被引量：2
4饶平.轻松管理企业基础架构[J].个人电脑,2001(9):19-20.
5范明,李川.在FP-树中挖掘频繁模式而不生成条件FP-树[J].计算机研究与发展,2003,40(8):1216-1222. 被引量：56
6宋宝莉,覃征.分布式环境下关联规则的安全挖掘算法[J].计算机工程,2006,32(21):35-37. 被引量：6
7宋宝莉,覃征.分布式数据库关联规则更新算法[J].西安交通大学学报,2007,41(4):416-420.
8飞云.巧用代码实现简洁替换[J].电脑爱好者,2012(23):66-66.
9董平,胥杰,苏力萍.一种基于TFP树的频繁项集改进挖掘算法[J].微计算机信息,2007,23(33):139-140. 被引量：2
10郑海明.基于FP-tree最大频繁项集的FP-MFI算法研究[J].现代计算机,2008,14(10):37-39. 被引量：1

现代计算机

2010年第1期

浏览历史

内容加载中请稍等...

在单向FP-tree上挖掘最大频繁项集被引量：1

参考文献18

二级参考文献16

共引文献263

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

在单向FP-tree上挖掘最大频繁项集 被引量：1

参考文献18

二级参考文献16

共引文献263

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

在单向FP-tree上挖掘最大频繁项集被引量：1