基于MapReduce计算模型的并行关联规则挖掘算法研究综述被引量：46

Parallel association rules mining algorithm based on MapReduce: a survey

下载PDF

导出

摘要随着数据的爆炸式增长,传统的算法已不能适应大数据挖掘的需要,需要分布式、并行的关联规则挖掘算法来解决上述问题。MapReduce是一种流行的分布式并行计算模型,因其使用简单、伸缩性好、自动负载均衡和自动容错等优点,得到了广泛的应用。对已有的基于MapReduce计算模型的并行关联规则挖掘算法进行了分类和综述,对其各自的优缺点和适用范围进行了总结,并对下一步的研究进行了展望。 With the explosive growth of data,traditional algorithms couldn’t meet the needs of the large data mining,it needed distributed parallel algorithm for mining association rules to solve the problem of mining association rules in large data.Map-Reduce was a kind of popular distributed parallel computing model,because of its simple to use,good scalability,the advantages of automatic load balancing and fault tolerance,had been widely used.This paper classified and reviewed the existing parallel algorithm for association rules minging based on MapReduce,summarized their respective advantages and disadvantages and scope of application,and prospected the next research.

作者肖文胡娟周晓峰 Xiao Wen;Hu Juan;Zhou Xiaofeng(Dept.of Electrical Information Engineering,Hohai University Wentian College,Maanshan Anhui 243031,China;School of Computer&Information,Hohai University,Nanjing 210098,China)

机构地区河海大学文天学院电气信息工程系河南大学计算机与信息学院

出处《计算机应用研究》 CSCD 北大核心 2018年第1期13-23,共11页 Application Research of Computers

基金安徽省高校自然科学研究项目(KJ2016A623)

关键词数据挖掘关联规则挖掘频繁项集并行 MAPREDUCE HADOOP data mining association rules mining frequent itemset parallel MapReduce Hadoop

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1谢志明,王鹏.基于MapReduce架构的并行矩阵Apriori算法[J].计算机应用研究,2017,34(2):401-404. 被引量：23
2DENG ZhiHong,WANG ZhongHui,JIANG JiaJian.A new algorithm for fast mining frequent itemsets using N-lists[J].Science China(Information Sciences),2012,55(9):2008-2030. 被引量：24
3周国军,龚榆桐.基于MapReduce和矩阵的频繁项集挖掘算法[J].微电子学与计算机,2016,33(5):119-123. 被引量：7
4杨勇,王伟.一种基于MapReduce的并行FP-growth算法[J].重庆邮电大学学报（自然科学版）,2013,25(5):651-657. 被引量：28
5黄立勤,柳燕煌.基于MapReduce并行的Apriori算法改进研究[J].福州大学学报（自然科学版）,2011,39(5):680-685. 被引量：19
6张春,汲磊举.基于MapReduce的Eclat改进算法研究与应用[J].北京交通大学学报,2016,40(3):1-6. 被引量：4
7郭进伟,皮建勇.基于MapReduce的SON算法实现[J].计算机应用,2014,34(A01):100-102. 被引量：7
8孙赵旭,谢晓兰,周国清,倪金生,胡莘.基于 Hadoop的Apriori算法与实现[J].桂林理工大学学报,2014,34(3):584-588. 被引量：10
9陈兴蜀,张帅,童浩,崔晓靖.基于布尔矩阵和MapReduce的FP-Growth算法[J].华南理工大学学报（自然科学版）,2014,42(1):135-141. 被引量：22

二级参考文献111

1施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
2邹翔,张巍,刘洋,蔡庆生.分布式序列模式发现算法的研究[J].软件学报,2005,16(7):1262-1269. 被引量：19
3刘德喜,何炎祥,邢显黎.一种新的频繁项集挖掘算法[J].计算机应用研究,2007,24(2):17-19. 被引量：8
4Dean J, Ghemmawat S. MapReduce: simplied data processing on large clusters [ C ]//Proceedings of the 6th Sympesium on Operating System Design and Implementation. New York: ACM Press, 2004:137 -150.
5Ranger C, Raghuraman R, Penmetsa A. Evaluating MapReduce for multicore and mutiprocessor systems [ C ] //Proceedings of the 2007 IEEE 13th International Symposium on High Performance Computer Architecture. Washington: IEEE Computer Society, 2007 : 13 -24.
6Kruuf M D, Sankaralinggam K. MapReduce for the cell B.E. architecture [ R ]. Madison: University of Wisconsin - Madison, 2007.
7He Bing - sheng, Fang Wen - bin, Naga K Govindaraju, et al. Mars : a MapReduce framework on graphics processors [ C ] // Proceedings of the 17th International Conference on Parallel Architectures and Compilation Techniques. New York: ACM Press, 2008 : 260 "269.
8Zaharia M, Konwinski A, Joseph A D. Improving MapReduce performance in heterogeneous environments [ C ] //Proceedings of the 8th USENIX Symposium on Operating Systems Design and Implementation. New York: ACM Press, 2008:29 -42.
9Tomwhite.Hadoop权威指南:中文版[M].曾大聃,周傲英,译.北京:清华大学出版社,2010.
10Chu Chen -tao, Kim S K, Lin Yian, et al. Map -Reduce for machine learning on muhicore [ C]//Twentieth Annual Conference on Neural Information Processing Systems, Vancouver: [ s. n. ], 2006 : 281 - 288.

共引文献115

1李强,吴裕雄,古国照,陈锡林,陈晔.智能辅助诊疗平台设计与探索[J].医学信息学杂志,2019,40(11):32-35. 被引量：2
2王越,赵静,杜冠瑶,万巍,龙春.网络空间安全日志关联分析的大数据应用[J].网络新媒体技术,2020(3):1-7. 被引量：2
3赵欣灿,朱云,毛伊敏.基于MapReduce的Apriori算法增量挖掘[J].计算机应用研究,2020,37(S02):73-75. 被引量：6
4黄东,陈光,李海滨,杨朔.Spark个性化地点推荐系统[J].辽宁工程技术大学学报（自然科学版）,2020(6):533-540. 被引量：1
5丁振,项颖.基于Hadoop的关联规则算法在电子商务中的应用[J].计算机与现代化,2012(8):122-125. 被引量：4
6张步忠,程玉胜,王则林.基于片上多核的频繁项集并行挖掘算法[J].计算机科学,2014,41(3):55-58. 被引量：3
7刘芳,吴广潮.一种基于压缩矩阵的改进Apriori算法[J].山东大学学报（工学版）,2018,48(6):82-88. 被引量：9
8周国军.一种基于MapReduce的关联规则挖掘算法[J].玉林师范学院学报,2014,35(5):128-134. 被引量：1
9潘恺,方沩,陈丽娜,曹永生.基于云计算的农作物种质资源数据挖掘平台研究[J].植物遗传资源学报,2015,16(3):649-652. 被引量：6
10李瑞霞,刘仁金,周先存.基于哈希表的MapReduce算法优化[J].山东大学学报（理学版）,2015,50(7):66-70. 被引量：4

同被引文献416

1王燕,亓祥惠,段亚西.基于核函数与马氏距离的FCM图像分割算法[J].计算机应用研究,2020,37(2):611-614. 被引量：14
2张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：18
3杜君.“大智移云”背景下企业业财融合模式的应用[J].智能计算机与应用,2020,0(1):253-256. 被引量：17
4杨勤科,李锐,曹明明.区域土壤侵蚀定量研究的国内外进展[J].地球科学进展,2006,21(8):849-856. 被引量：66
5孙崇亮,王卷乐.基于DEM的水系自动提取与分级研究进展[J].地理科学进展,2008,27(1):118-124. 被引量：46
6孔亚平,张科利,曹龙熹.土壤侵蚀研究中的坡长因子评价问题[J].水土保持研究,2008,15(4):43-47. 被引量：37
7黄建明,赵文静,王星星.基于十字链表的Apriori改进算法[J].计算机工程,2009,35(2):37-38. 被引量：25
8张立众.EtherNet/IP节点的设计[J].化工自动化及仪表,2010,37(3):100-102. 被引量：3
9熊忠阳,陈培恩,张玉芳.基于散列布尔矩阵的关联规则Eclat改进算法[J].计算机应用研究,2010,27(4):1323-1325. 被引量：18
10袁晓光,杨万海,史林.动态大规模无线传感器网络决策融合[J].电子与信息学报,2010,32(12):2976-2980. 被引量：4

引证文献46

1陈珂.“互联网+”背景下业财融合路径研究[J].投资与创业,2021(5):52-54. 被引量：1
2张航,张欣,张平康,李琪.基于MapReduce的并行加权FIUT算法[J].微电子学与计算机,2018,35(7):41-44. 被引量：1
3叶梦雄.基于关联规则挖掘算法的教务管理系统设计[J].机械设计与制造工程,2018,47(8):123-126. 被引量：4
4张雪梅.基于大数据的液压支架电液控制系统故障诊断[J].工矿自动化,2018,44(12):34-38. 被引量：27
5梁瑷云,袁丁,严清,刘小久.Spark平台下关联规则算法的优化实现[J].计算机工程与设计,2018,39(12):3692-3699. 被引量：4
6郭燚,张卫山,徐亮,翟佳.基于微服务的石油大数据挖掘平台[J].计算机与现代化,2019(5):25-29. 被引量：1
7王猛,张宏鸣.基于MapReduce模型的侵蚀地形因子计算方法研究[J].计算机应用研究,2019,36(6):1700-1704. 被引量：3
8张航,张欣,张平康,李琪.基于FIUT的并行频繁项集增量更新算法[J].计算机应用研究,2019,36(7):1991-1993. 被引量：4
9王青松,姜富山.Hadoop框架下的一种改进的Apriori算法[J].辽宁大学学报（自然科学版）,2019,46(3):257-264. 被引量：2
10郑宪秋.基于时空约束和小波设计的非侵入式负载数据协同挖掘算法[J].西安工程大学学报,2019,33(6):643-648. 被引量：9

二级引证文献137

1李叶,毛伊敏,陈志刚.基于Winograd卷积的并行深度卷积神经网络优化算法[J].信息与控制,2023,52(4):466-482.
2辛亮.液压支架电液控制系统故障分析及维修技术的应用[J].内蒙古石油化工,2021,47(10):78-81. 被引量：4
3杨坤.液压支架电液控制器设计研究[J].自动化应用,2019(2):43-44. 被引量：1
4史洪泉.液压支架电液控制系统故障快速诊断技术[J].自动化应用,2019(4):33-34. 被引量：6
5李海明.液压支架泄漏故障诊断机理及应用研究[J].机械管理开发,2019,34(6):120-121.
6张仁生.液压支架电液控制系统故障诊断技术探讨[J].今日自动化,2019,0(4):123-124.
7刘丰军.基于大数据技术的煤矿应急救援辅助决策系统的研究[J].山东煤炭科技,2019,0(10):156-157. 被引量：6
8张维国.数据仓库技术在高校教务系统中的应用[J].福建电脑,2019,35(9):33-38. 被引量：2
9胡云.探讨高端液压支架管路系统的优化改造[J].机械管理开发,2020,35(3):252-253. 被引量：2
10郑沁楠.液压支架电液控制系统故障快速诊断[J].能源与节能,2020,0(4):72-73. 被引量：8

1俞洋,吴庭芳,贺娟娟.基于合作规则的脉冲神经膜系统的小通用性[J].系统工程理论与实践,2017,37(9):2465-2473. 被引量：1
2刘雪冉.基于Apriori算法的郑州市手机消费市场关联规则挖掘[J].知识经济,2018(10):55-56. 被引量：1
3顾武雄.详解数据库镜像[J].网络安全和信息化,2018,0(2):73-78. 被引量：1
4金崇英,李小勇,白英彩.海量存储系统的发展与展望[J].计算机应用与软件,2011,28(8):193-195. 被引量：6
5苗青,胡镜清,张俊华,岳广欣,柏冬,刘振丽,王淳,王瑞海,宋志前,杨阳,刘丽梅.基于关联规则挖掘的中药治疗心血管疾病组分配伍规律研究[J].中草药,2018,49(6):1461-1467. 被引量：7
6孙丰杰,王承民,谢宁.面向智能电网大数据关联规则挖掘的频繁模式网络模型[J].电力自动化设备,2018,38(5):110-116. 被引量：29

计算机应用研究

2018年第1期

浏览历史

内容加载中请稍等...

基于MapReduce计算模型的并行关联规则挖掘算法研究综述被引量：46

参考文献9

二级参考文献111

共引文献115

同被引文献416

引证文献46

二级引证文献137

相关作者

相关机构

相关主题

浏览历史

基于MapReduce计算模型的并行关联规则挖掘算法研究综述 被引量：46

参考文献9

二级参考文献111

共引文献115

同被引文献416

引证文献46

二级引证文献137

相关作者

相关机构

相关主题

浏览历史

基于MapReduce计算模型的并行关联规则挖掘算法研究综述被引量：46