基于MapReduce的数据挖掘平台设计与实现被引量：45

Design and implementation of MapReduce-based data mining platform

下载PDF

导出

摘要 MapReduce编程模型的简单性和高性价比使得其适用于海量数据的并行处理。然而,MapReduce欠缺对多数据源、组件复用以及数据可视化支持,这些缺点使用户在运用MapReduce框架进行数据挖掘时暴露出开发效率低下,重复开发等问题。提出了一种基于MapReduce的数据挖掘平台的设计与实现,该设计思想为Hadoop作为大规模数据计算平台在数据挖掘、数据可视化以及商业智能应用方面的不足提供了参考与弥补。同时,基于该方法实现了一个大规模数据挖掘工具。 Profiting from its simplicity and high cost performance, MapReduce programming paradigm is suitable for massive parallel data processing. However, MapReduee＇s lacking supports for multiple data source, component reuse, and data visua lization bring in problems such as low efficiency development and redundant coding. A new design and implementation of MapRe ducebased data mining platform is proposed to give reference implementation of massive data mining, data visualization and busi ness intelligence applications based on Hadoop. Based on this proposal, a massive data mining tool is implemented.

作者黄斌许舒人蒲卫

机构地区中国科学院软件研究所软件工程技术中心中国科学院研究生院解放军卫生信息中心

出处《计算机工程与设计》 CSCD 北大核心 2013年第2期495-501,共7页 Computer Engineering and Design

基金国家科技重大专项核高基基金项目(2010ZX01042-001-001-05) 国家科技支撑计划基金项目(2012BAH05F02 2011BAH15B03)

关键词 MapReduce编程模型数据挖掘 HADOOP平台模型驱动可视化 MapReduce programming model data mining Hadoop platform model-driven development visualization

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献310

1何忠育,王勇,王瑛,陈新,廖朝辉.基于分布式计算的网络舆情分析系统的设计[J].警察技术,2010(3):19-22. 被引量：6
2刘云霞.统计学专业本科生开设“数据挖掘”课程的探讨[J].吉林工程技术师范学院学报,2010,26(6):20-22. 被引量：8
3潘芳,仲伟俊,胡彬,徐敬海.突发事件网络舆情的管控机制及效率测评[J].情报杂志,2012,31(5):40-45. 被引量：12
4崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
5刘正伟,文中领,张海涛.云计算和云数据管理技术[J].计算机研究与发展,2012,49(S1):26-31. 被引量：170
6章志刚,吉根林.基于迭代式MapReduce的Apriori算法设计与实现[J].华中科技大学学报（自然科学版）,2012,40(S1):9-12. 被引量：8
7袁挺,纪超,陈英,李伟,张俊雄.基于光谱成像技术的温室黄瓜识别方法[J].农业机械学报,2011,42(S1):172-176. 被引量：35
8江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
9武林平,张晓霞,王伟,罗红兵.集群系统运行状态监控软件设计[J].华中科技大学学报（自然科学版）,2011,39(S1):148-152. 被引量：2
10张铁中,杨丽,陈兵旗,张宾.农业机器人技术研究进展[J].中国科学：信息科学,2010,40(S1):71-87. 被引量：55

引证文献45

1王少锋,伍少成,刘涛,邓琨,黄兵.对Hadoop的用电信息大数据计算服务应用分析[J].自动化与仪器仪表,2016(4):221-222. 被引量：6
2肖丹,尹春华.基于改进蚁群算法的用户有效浏览兴趣路径挖掘[J].计算机与现代化,2013(12):14-18.
3朱月恒.基于并行计算的大数据挖掘技术研究[J].网络安全技术与应用,2014(5):53-53. 被引量：2
4马宏斌,王青山,王柯.一种地理空间数据即服务私有云设计[J].测绘与空间地理信息,2014,37(5):19-21. 被引量：8
5马宏斌,王柯,马团学.大数据时代的空间数据挖掘综述[J].测绘与空间地理信息,2014,37(7):19-22. 被引量：17
6黄蔚,李戴维.基于MapReduce的网络舆情分析系统的设计与实现[J].信息技术,2014,38(7):149-153. 被引量：2
7刘树仁,冯超敏,文玲,蔡长宁,赵书贵.基于Hadoop的高性能集群状态监测分析[J].计算机工程与设计,2014,35(11):4049-4053. 被引量：1
8张家瑞.基于MapReduce的数据挖掘平台设计与实现[J].网络安全技术与应用,2014(11):49-49.
9赖剑菲,江舟.基于WLAN的图书馆读者行为采集分析平台框架研究[J].图书情报工作,2015,59(10):67-71. 被引量：6
10王相伟,史玉良,张建林,梁波,程翠萍.基于Hadoop的用电信息大数据计算服务及应用[J].电网技术,2015,39(11):3128-3133. 被引量：37

二级引证文献241

1杨晓雁,申澳.关于互联网大数据处理研究的分析[J].计算机产品与流通,2020,0(6):126-126.
2蒋科.移动互联网医疗云平台关键技术研究[J].网络安全技术与应用,2020(3):104-106. 被引量：4
3张昊,蒋毅.面向嵌入式机器视觉的图编程式算法开发平台设计[J].电子测量技术,2020(9):171-176. 被引量：6
4吴军,陈作懿,严喆,王吉,胡奎.基于Hadoop的船舶轴承健康状态监测系统设计[J].兵器装备工程学报,2020,0(1):140-144. 被引量：4
5陈建煊.利益相关者管理[J].经济管理,2000,26(4):58-58. 被引量：3
6殷碧文.加筋土挡土墙设计与施工[J].工程设计与研究（长沙）,2000(1):29-32. 被引量：1
7徐赐发.数据挖掘在软件工程领域中的应用浅析[J].电子技术与软件工程,2014(19):206-206. 被引量：6
8黄世云.软件工程数据挖掘研究进展概述[J].电子技术与软件工程,2014(21):89-89. 被引量：5
9何家凤,何少武.大数据时代的纳税评估信息采集模式[J].财经理论与实践,2015,36(3):95-98. 被引量：8
10张灿.数据挖掘技术在软件工程中的应用综述[J].信息通信,2014,27(11):141-141. 被引量：2

1于乐,赵帅,章洋,吴斌,王柏,邓超,陈俊亮.云工作流技术在商业智能SaaS中的应用[J].计算机集成制造系统,2013,19(8):1738-1747. 被引量：7
2黄锦辉.开发商业智能应用小心大数据“陷阱”[J].大数据,2017,3(2):26-30. 被引量：2
3黄炜,姚天昉.商业智能应用的结果信息展示[J].微型电脑应用,2007,23(5):50-55.
4尚晓丽,包向辉,刘井莲,白彦国.基于UML的聋人教学网站的构建[J].赤峰学院学报（自然科学版）,2014,30(21):15-16.
5余长慧,潘和平.商业智能及其核心技术[J].计算机应用研究,2002,19(9):14-16. 被引量：42
6SAS@9召开企业级商业智能研讨会[J].电信技术,2005(7):98-98.
7崔晓风,项昌乐,王战军,郝会兵,刘正道.装备维修可视化支持系统研究[J].煤矿机械,2010(1):217-219. 被引量：3
8阮琼,王慧娟,李强,叶新华,熊世勇.通过创新技术手段探索商业智能应用[J].电力信息化,2011,9(7):50-53.
9应用进展[J].开放系统世界,2006(5):21-21.
10醇.SAS召开企业级商业智能研讨会[J].中国信息化,2005(13):92-92.

计算机工程与设计

2013年第2期

浏览历史

内容加载中请稍等...

基于MapReduce的数据挖掘平台设计与实现被引量：45

同被引文献310

引证文献45

二级引证文献241

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的数据挖掘平台设计与实现 被引量：45

同被引文献310

引证文献45

二级引证文献241

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的数据挖掘平台设计与实现被引量：45