一种自底向上的最大频繁项集挖掘方法被引量：3

A Bottom-up Method for Mining Maximum Frequent Itemsets

下载PDF

导出

摘要频繁项集挖掘是关联规则挖掘中最关键的步骤。最大频繁项集是一种常用的频繁项集简化表示方法。自顶向下的最大频繁项集挖掘方法在最大频繁项集维度远小于频繁项数时往往会产生过多的候选频繁项集。已有的自底向上的最大频繁项集挖掘方法或者需多次遍历数据库,或者需递归生成条件频繁模式树,而预测剪枝策略有进一步提升的空间。为此,提出了基于最小非频繁项集的最大频繁项集挖掘算法(BNFIA),采用基于DFP-tree的存储结构,通过自底向上的方式挖掘出最小非频繁项集,利用最小非频繁项集的性质进行预测剪枝,以缩小搜索空间,再通过边界频繁项集快速挖掘出最大频繁项集。验证实验结果表明,提出算法的性能较同类算法有较为明显的提升。 Mining frequent itemsets is the most critical step in mining association rules. Maximum frequent itemsets is a common com- pressed representation of frequent itemsets. In mining maximum frequent itemsets, the top-down methods would produce lots of candidate itemsets when the dimensions of maximum frequent itemsets is smaller than the number of frequent itemsets. The existing bottom-up methods need either traversal in database many times or building FP-trce recursively, and the prediction pruning strategies have further room for improvement. The algorithm of discovering maximum frequent itemsets based on minimum non-frequent itemsets named BN- FIA has been proposed,which uses storage structure based on FP-tree and digs out the minimum non-frequent itemsets through a bottom -up approach first,then prunes with the minimum non-frequent itemsets to narrow search space for acquiring the maximum frequent itemsets fast through boundary frequent itemsets. Experimental results show that the proposed algorithm has performed better than the al- gorithm with same type.

作者赵阳吴廖丹

机构地区江南计算技术研究所

出处《计算机技术与发展》 2017年第8期57-60,65,共5页 Computer Technology and Development

基金国家科技重点专项"核高基"(2015ZX01040-201)

关键词最大频繁项集关联规则挖掘 FP-TREE 最小非频繁项集边界频繁项集 maximum frequent itemsets association rules mining FP-tree minimum non-frequent itemsets boundary frequent itemsets

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
2宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164
3吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
4钱雪忠,惠亮.关联规则中基于降维的最大频繁模式挖掘算法[J].计算机应用,2011,31(5):1339-1343. 被引量：13
5杨鹏坤,彭慧,周晓锋,孙玉庆.改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J].计算机应用,2015,35(3):775-778. 被引量：16
6秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26

二级参考文献48

1秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
2吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
3颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：68
4秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26
5周钦亮,李玉忱,公爱国.一种新的高效生成FP-Tree条件模式基的算法[J].计算机应用,2006,26(6):1418-1421. 被引量：7
6.[EB/OL].http://www. ics. uci. edu/～ mlearn/MLRepository. html,1996.
7Han J.W.,Kamber M..Data Mining:Concepts and Techniques.Beijing:Higher Education Press,2001.
8Agrawal R.,ImielinSki T.,Swami A..Mining association rules between sets of items in large database.In:Proceedings of the ACM SIGMOD International Conference on Managementof Data,Washington,DC,1993,2:207-216.
9Srikant A.R..Fast algorithms for mining association rules.In:Proceedings of the 20th International Conference Very Large Data Bases(VLDB’94).Santiago,Chile,1994,487-499.
10Han J.W.,Pei J.,Yin Y..Mining partial periodicity using frequent pattern tree.Simon Fraser University:Technical Report TR-99-10,1999.

共引文献268

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2
6杨君锐.逆向启发式开采最大频繁项目集[J].计算机工程,2004,30(14):116-118. 被引量：1
7朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
8杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
9张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
10李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3

同被引文献15

1邹力鹍,张其善.基于CAN-树的高效关联规则增量挖掘算法[J].计算机工程,2008,34(3):29-31. 被引量：9
2李也白,唐辉,张淳,贺玉明.基于改进的FP-tree的频繁模式挖掘算法[J].计算机应用,2011,31(1):101-103. 被引量：21
3黄红星,王秀丽,黄习培.挖掘最大频繁项集的改进蚁群算法[J].计算机工程与应用,2011,47(13):161-165. 被引量：3
4陈昌敏,谢维成,范颂颂.自适应和最大最小蚁群算法的物流车辆路径优化比较[J].西华大学学报（自然科学版）,2011,30(3):5-8. 被引量：8
5马丽生,姚光顺,杨传健.基于改进FP-tree的最大频繁项目集挖掘算法[J].计算机应用,2012,32(2):326-329. 被引量：8
6陈刚,闫英战,刘秉权.一种基于CAN-tree快速构建算法[J].微电子学与计算机,2014,31(1):76-82. 被引量：4
7郭进伟,皮建勇.一种基于FP-growth的并行SON算法的实现[J].微型机与应用,2014,33(8):60-63. 被引量：2
8牛新征,杨健,佘堃.基于数组前缀树的频繁项集挖掘算法[J].小型微型计算机系统,2014,35(8):1693-1698. 被引量：5
9周发超,王志坚,叶枫,邓玲玲.关联规则挖掘算法Apriori的研究改进[J].计算机科学与探索,2015,9(9):1075-1083. 被引量：32
10宁慧,王素红,崔立刚,郭笑语,徐丽.基于改进的FP-tree最大频繁模式挖掘算法[J].应用科技,2016,43(2):37-43. 被引量：4

引证文献3

1佘雅莉,周良.基于混合蚁群关联规则挖掘的危险源分析算法[J].计算机技术与发展,2018,28(11):89-93. 被引量：3
2杜媛,张世伟.基于重构的改进自然排序树算法[J].计算机应用,2019,39(2):441-445.
3杜媛,张世伟.基于数组和辅助项头表的快速频繁项集挖掘算法[J].中国计量大学学报,2019,30(1):78-84. 被引量：2

二级引证文献5

1钟倩漪,钱谦,伏云发,冯勇.粒子群优化算法在关联规则挖掘中的研究综述[J].计算机科学与探索,2021,15(5):777-793. 被引量：26
2魏坤,王芳,黄树成.改进的频繁模式挖掘算法[J].计算机与数字工程,2021,49(11):2175-2179.
3郝婉琳.面向大学生心理健康预警的因素灰度关联算法研究[J].电子设计工程,2022,30(11):12-16.
4陈鞭,伍友利,吴鑫,甘跃鹏.红外对抗中各因素之间关系的深度挖掘[J].航空兵器,2022,29(3):42-46.
5唐建海.基于Hadoop平台的网络安全趋势大数据挖掘算法[J].工业加热,2022,51(7):67-70. 被引量：5

1张海清,李代伟,刘胤田,龚程,于曦.最大模糊频繁模式挖掘算法[J].计算机应用,2017,37(5):1424-1429. 被引量：1
2万青,马盈仓.基于属性概念的决策形式背景协调性研究[J].西北大学学报（自然科学版）,2017,47(3):336-341. 被引量：3
3彭剑.分批运输的农产品基地-工厂供应链调度算法[J].控制工程,2016,23(6):949-955.

计算机技术与发展

2017年第8期

浏览历史

内容加载中请稍等...

一种自底向上的最大频繁项集挖掘方法被引量：3

参考文献6

二级参考文献48

共引文献268

同被引文献15

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种自底向上的最大频繁项集挖掘方法 被引量：3

参考文献6

二级参考文献48

共引文献268

同被引文献15

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种自底向上的最大频繁项集挖掘方法被引量：3