一种针对大型事务数据库的关联规则挖掘算法被引量：2

Algorithm of Association Rule Mining for Large Transaction Databases

下载PDF

导出

摘要为进一步解决对大型数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁问题,给出一种改进的关联规则挖掘算法(ARMAC).该算法引入有向无环图和tidlist结构用以提高频繁项目集的计算效率,并将数据库划分为内存可以满足要求的若干部分,解决了对大型数据库挖掘时磁盘操作频繁的问题,从而有效地适用于大型数据库的关联规则挖掘.该算法吸取连续关联规则挖掘(CARMA)算法的优势,只需扫描两次数据库便可完成挖掘过程.实验结果表明:该算法在大型事务数据库中具有更高的执行效率. To further reduce both the large overhead of CPU and frequent operation of I/O occurred in the process of the association rules mining on the large transaction database,this paper presents an improved algorithm of association rule mining（ARMAC）.In this algorithm,a directed acyclic graph（DAG） and the tidlist configuration are taken to improve the computing efficiency of the frequent item sets,and the database is partitioned into several parts whose RAM can meet the corresponding demand,thus overcoming the problems of disk’s frequent operation on mining the large database,which is effectively applied to the association rule mining of large database.Taking advantages of the algorithm of continuous association rule mining（CARMA）,this improved algorithm can implement the mining by only scanning the database twice.Experimental results show that this proposed algorithm is of higher execution efficiency in large transaction database.

作者崔建李强王国师

机构地区空军雷达学院研究生管理大队空军雷达学院四系

出处《空军雷达学院学报》 2011年第3期205-208,共4页 Journal of Air Force Radar Academy

关键词数据挖掘频繁项集大型数据库有向无环图关联规则 data mining frequent item sets large database directed acyclic graph（DAG） association rules

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1SAVASERE A, OMIEC1NSKI E, NAVATHE S. An efficient algorithm for mining association rules in large databases [C]//Proc. of Intl. Conf. on Very Large Databases.1995: 432-444.
2HIDBER C. Online association rule mining[C]//Proc, of ACM SIGMOD Intl. Conf. on Management of Data. 1999: 145-156.
3LIN J, DUNFIAM M H. Mining association roles: Antiskew algorithrns[C]//Proc, of Intl. Conf. on Data Engineering (ICDE). 1998: 236-251.
4SHENOY P, HARITSA J R, SUDARSHAN S, et al. Turbo- charging vertical mining of large databases [C]//Proc. of Intl. Conf. Management of Data. 2000: 22-23.
5PUDI V, HARITSA J. Quantifying the utility of the past in mining large databases [J]. Information Systems, 2000, 25 (5):323-343.
6丁艳辉,王洪国,高明,谷建军.一种基于矩阵的关联规则挖掘新算法[J].计算机科学,2006,33(4):188-189. 被引量：13
7HU Ya-han, CHEN Liang. Mining association rules with multiple minimum supports a new mining algorithm and a support tuning mechanism [J]. Decision Support System, 2006, 42(1): 1-24.
8郑泉,王建东.基于FP-树挖掘大数据库的方法及算法PCM[J].计算机工程与应用,2004,40(7):182-184. 被引量：6
9HAN J, PEI J, Y1N Y. Mining frequent pattems without candidate generation [J]. Data Mining and Knowledge Discovery, 2004, 8(1):53-87.
10AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules in large databaes [C]//Proc. of 1994 International Conference on Very Large Databases. 1994: 487-499.

二级参考文献10

1[1]Jiawei Han,Micheline Kamber. Data Mining:Concepts and Techniques.CopyrightC2001 by Morgan Kaufmann Publishers,Inc
2[2]R Agrawal ,R Srikant. Fast algorithms for mining association rules[C].In:Proc 1994 Int Conf Very Large Data Bases(VLDB'94),Santiago,Chile, 1994-09
3[3]J Han,J Pei,Y Yin. Mining frequent patterns without candidate generation[C].In:Pro 2000 ACM-SIGMOD Int Conf Management of Data(SIGMOD'00), Dallas ,TX ,2000-05:1～12
4[4]R Agarwal,C Aggarwal,V V V Prasad. A tree projection algorithm for generation of frequent itemsets. In J Parallel and Distribute Computing, 2000
5Agrawal R, Srikant R. Mining sequential patterns: [IBM Research Report]. 1995
6Agrawal R, Imielinski T, Swami A. Mining association rules between sets in large databases, In: Proc. the ACM SIGMOD Conf,Management of Data, May 1993, 207-216
7Agrawal R, Srikant R. Fast algorithm for mining association rules: [IBM Research Reprot], 1994
8Agrawal R, Mannila H,Toivonen H, et al. Fast Discovery of Association Rules. In Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press,1996. 306-328
9Huang Liusheng, Chen Huaping, Wang Xun , Cheng Guoliang ,A Fast Algorithm for Mining Association Rules, In J, Comput .Sei, & Technol, ,2000,15(6):619-624
10Jiawei Han, Micheline Kamber. Data Mining :Concepts and Techniques[C]. Mongan Kaufmann publishers, 2000. 225-278

共引文献16

1薛永庆,徐维祥.一种适应大型数据库的多支持度关联规则算法[J].计算机工程与应用,2008,44(2):182-185. 被引量：1
2卢雪燕,王勇,周永权.一种基于位矩阵的负关联规则挖掘新算法[J].广西民族大学学报（自然科学版）,2007,13(4):57-60. 被引量：3
3冯贺,陶宏才.基于事务矩阵的关联规则挖掘算法[J].电脑学习,2008(5):46-47.
4傅慧,邹海.基于待与项集的频繁项集挖掘算法的研究[J].计算机工程与设计,2009,30(1):129-131. 被引量：4
5周海岩.建立频繁项目集向量的极大频繁项目集挖掘[J].系统工程与电子技术,2009,31(10):2497-2500.
6刘洋,王勇.一种求极大频繁项集的挖掘方法[J].广西民族大学学报（自然科学版）,2009,15(4):89-93.
7吴仁堂,周根宝.基于模式矩阵匹配的关联规则挖掘算法[J].内蒙古农业大学学报（自然科学版）,2009(3):190-193.
8崔建,李强,杨龙坡.基于垂直数据分布的大型稠密数据库快速关联规则挖掘算法[J].计算机科学,2011,38(4):216-220. 被引量：24
9吕桃霞,刘培玉.一种基于矩阵的强关联规则生成算法[J].计算机应用研究,2011,28(4):1301-1303. 被引量：17
10陈衡.改进的Apriori算法在电大学生信息挖掘中的应用[J].淮北职业技术学院学报,2011,10(3):131-132.

同被引文献12

1陈辉,向伟忠,单健.关联规则挖掘在教师教学评价系统中的应用[J].南华大学学报（自然科学版）,2005,19(1):104-107. 被引量：11
2曾五一,黄炳艺.调查问卷的可信度和有效度分析[J].统计与信息论坛,2005,20(6):11-15. 被引量：352
3邢东旭,申海涛,孟海东.基于距离的关联规则挖掘算法研究[J].内蒙古大学学报（自然科学版）,2010,41(6):703-706. 被引量：6
4赵洪英,蔡乐才,李先杰.关联规则挖掘的Apriori算法综述[J].四川理工学院学报（自然科学版）,2011,24(1):66-70. 被引量：86
5尤兰芳.大学生考试作弊研究——基于某高校2001-2009年356名作弊大学生处分档案资料的分析[J].法制与社会（旬刊）,2011(15):230-233. 被引量：6
6毛宇星,陈彤兵,施伯乐.一种高效的多层和概化关联规则挖掘方法[J].软件学报,2011,22(12):2965-2980. 被引量：37
7王云峰.大学生作弊心理的调查研究与教育策略[J].高校辅导员学刊,2011,3(6):62-67. 被引量：10
8孟海东,李丹丹,吴鹏飞.基于数据场的量化关联规则挖掘方法设计[J].计算机与现代化,2013(1):8-11. 被引量：7
9王璇,马琪山,豆红霞.我国老年心理健康研究的文献统计分析[J].中国老年学杂志,2013,33(19):4827-4829. 被引量：17
10高峰,谢剑英.发现关联规则的增量式更新算法[J].计算机工程,2000,26(12):49-50. 被引量：10

引证文献2

1朱红霞,王亚梅,游星.关联规则挖掘下的作弊分析[J].四川文理学院学报,2015,25(5):56-59.
2丁一琦.基于关联挖掘技术的老年心理健康状况研究[J].黑龙江科技信息,2016(30):49-49. 被引量：1

二级引证文献1

1王猛,宋文宽,刘军,赵雨璇,戚敬峰.基于跨界养老服务平台的老年诈骗识别防范技术研究与实现[J].枣庄学院学报,2021,38(2):20-28. 被引量：1

1叶阳东,姬安明,潘玉英,范明.相联规则发现的一般性算法研究[J].计算机科学,1997,24(4):47-48. 被引量：5
2朱玉全,孙志挥,季小俊.基于频繁模式树的关联规则增量式更新算法[J].计算机学报,2003,26(1):91-96. 被引量：80
3董宁.基于数据挖掘的Apriori算法研究与改进[J].自动化与仪器仪表,2016(9):232-234. 被引量：5
4涂承胜.关联规则挖掘的常用算法及其比较分析[J].重庆三峡学院学报,2006,22(3):22-23. 被引量：8
5朱玉全,孙志挥.大型事务数据库中的一种快速的规则挖掘算法[J].计算机科学,2002,29(10):59-60. 被引量：4
6范明,牛常勇,朱琰.一种挖掘多维关联规则的有效算法[J].计算机科学,2001,28(11):44-47. 被引量：7
7董引娣.数据挖掘中关联规则在零售业中的应用[J].信息与电脑,2009,21(11):62-65.
8倪坚.对Apriori算法的一个改进[J].大连交通大学学报,2007,28(2):88-89. 被引量：9
9吴志丹,赵大宇,唐恒永.一种改进的关联规则挖掘算法[J].沈阳师范大学学报（自然科学版）,2006,24(3):257-259. 被引量：4
10冯洁,陶宏才.典型关联规则挖掘算法的分析与比较[J].计算机技术与发展,2007,17(3):121-124. 被引量：12

空军雷达学院学报

2011年第3期

浏览历史

内容加载中请稍等...

一种针对大型事务数据库的关联规则挖掘算法被引量：2

参考文献10

二级参考文献10

共引文献16

同被引文献12

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种针对大型事务数据库的关联规则挖掘算法 被引量：2

参考文献10

二级参考文献10

共引文献16

同被引文献12

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种针对大型事务数据库的关联规则挖掘算法被引量：2