基于Hadoop平台的Spark框架研究被引量：14

Spark Framework Based on Hadoop Platform

下载PDF

导出

摘要 Hadoop是大数据挖掘的主流平台,在该平台上可以进行大数据的挖掘。数据挖掘的规模和速度是我们需要考虑的问题。Spark框架是一个优秀的框架,它集机器学习,图计算和在线学习为一身,是简洁、强大、高效的。该文先讨论了Spark的组成,接着讨论Spark的任务调度方式,最后讨论了Spark的环境及测试。 Hadoop is the main platform of big data mining on which you can mine big data.The scale and speed of data mining is an issue we need to consider. Spark framework is an excellent framework, which combines machine learning, graphs computing and online processing in one framework, which is a simple, powerful and efficient. This paper first discusses the Spark composition, followed by a discussion Spark task scheduling, and finally discuss the environment and test the Spark.

作者陈虹君

机构地区电子科技大学成都学院

出处《电脑知识与技术（过刊）》 2014年第12X期8407-8408,共2页 Computer Knowledge and Technology

关键词大数据 HADOOP SPARK 机器学习图计算实时处理 big data Hadoop Spark machine learnin graphs computing online processing

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献53

1崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
2季桂树,陈沛玲,宋航.决策树分类算法研究综述[J].科技广场,2007(1):9-12. 被引量：40
3刘平峰,聂规划,陈冬林.基于知识的电子商务智能推荐系统平台设计[J].计算机工程与应用,2007,43(19):199-201. 被引量：19
4SPIEWAK D, ZHAO Tian. ScalaQL: Language-integrated data- base queries for scala [C]// Proceedings of Second International Conference on Software Language Engineering. [S.I.: s.n.], 2009: 154-163.
5Anon. Resilient distributed datasets: a fault-tolerant abstraction for in - memory cluster computing, UCB/EECS - 2011 - 82 [R]. Berkeley: EECS Department, University of California , 2011.
6BU Yingyi, HOWE B, BALAZ1NSKA M, et al. Ernst. HaLoop: efficient iterative data processing on large clusters []]. Proceedings of VLDB endowment, 2010, 3(1): 285-296.
7李亚萍,马蓉.土地适宜性评价方法研究[J].现代化农业,2009(3):30-32. 被引量：18
8林清滢.基于Hadoop的云计算模型[J].现代计算机,2010,16(7):114-116. 被引量：27
9孙建伟,孙昭晨,陈轩,耿红.NetCDF格式数据的创建及应用[J].交通标准化,2010,38(15):31-34. 被引量：15
10所剑,王大广,刘泽锋.早期胃癌诊断和治疗[J].中国实用外科杂志,2011,31(8):717-719. 被引量：54

引证文献14

1陈虹君,吴雪琴.基于Hadoop平台的Spark快数据推荐算法分析与应用[J].现代电子技术,2016,39(10):18-20. 被引量：12
2张亮,杨春丽,马媛媛.大数据应用部署研究[J].电信网技术,2016,0(5):30-36. 被引量：2
3文琴,罗飞,曹亮.土地适宜性分析的数据处理技术框架及其构件研究[J].电子技术与软件工程,2017(2):207-208.
4曹耀辉.基于Spark平台的电商推荐系统的设计分析[J].自动化与仪器仪表,2017(7):100-103. 被引量：3
5李嘉恩.大数据和云计算平台应用分析[J].无线互联科技,2017,14(20):60-61. 被引量：2
6迟翕幻.决策树多元分类模型预测森林植被覆盖[J].电子制作,2017,25(24):25-26.
7丁东亮,吴东月,于福利.Spark在人类基因领域的应用[J].计算机科学,2016,43(S1):502-504 528. 被引量：1
8胡建华.基于简化分布式模型与数据结构理论的SPARK教学方法研究[J].计算机教育,2018(6):94-96. 被引量：2
9许礼捷.基于Spark的大数据处理平台的搭建与研究[J].电脑知识与技术,2016,12(5X):14-16. 被引量：4
10杨茵.基于Spark的固网业务日志统计分析平台设计与应用[J].电信科学,2017,33(S2):277-284.

二级引证文献36

1邱莉萍,鞠海军,龚晓敏,邓拓,刘林玉.分布式计算框架的大数据机器学习探析[J].计算机产品与流通,2020(10):179-179.
2胡常礼,邵剑飞.基于分布式计算框架的机器学习系统分析[J].电视技术,2021,45(11):115-118. 被引量：2
3王斌,张昱.通信运营企业大数据平台建设思考[J].邮电设计技术,2017(8):73-78. 被引量：4
4董晓萍,王大刚,邢阳.大数据在卷烟市场状态监测中的应用研究[J].信息技术与标准化,2017(10):65-69. 被引量：3
5陈粤龙,张治中,符静.智慧旅游客情监控平台的设计与实现[J].信息通信,2018,0(2):52-55.
6祝永志.基于Spark技术的协同过滤推荐算法的可扩放性研究[J].电子技术（上海）,2018,47(7):41-42. 被引量：1
7杨华.基于云计算的大数据分析平台设计[J].电脑编程技巧与维护,2018(6):103-104. 被引量：3
8赵瑞丹.基于大数据分析的思政教学系统的设计与实现[J].自动化与仪器仪表,2018,0(8):117-119. 被引量：5
9黄小飞,冯彬.面向智能制造的大数据分析技术研究[J].信息通信,2018,31(10):226-228. 被引量：4
10杨茵.基于Spark的固网业务日志统计分析平台设计与应用[J].电信科学,2017,33(S2):277-284.

1李盛明.即将到来的大数据时代[J].党建文汇（下半月）,2013(3):49-49.
2梁成.浅谈交通视频中的行人检测重要性[J].福建电脑,2012,28(10):98-99.
3郑志娴,陈华,徐榕生.高速网络自适应负载均衡技术的实现[J].电脑知识与技术,2007(8):729-730. 被引量：1
4互联网时代最大者生存[J].世界电信,2012(12):26-26.
5郭瑞强.论网络销售人员应具备的基本能力[J].商品与质量（消费研究）,2014(8):98-98.
6刘永华,杨淑威.信息技术为状态检修保驾护航[J].中国电力企业管理,2009(8X):41-42.
7姜天露.组建电信级Internet五大问题[J].中国计算机用户,2000(25):53-53.
8董瑜,张基温.改进的双要素蠕虫传播模型[J].微计算机信息,2005,21(12X):80-81. 被引量：4
9杨辉军.一个改进的蠕虫传播模型研究[J].长江大学学报（自科版）（上旬）,2009,6(4):112-113.
10尹友明.局域网中的路由交换技术探析[J].科技创新与应用,2013,3(28):76-76.

电脑知识与技术（过刊）

2014年第12X期

浏览历史

内容加载中请稍等...

基于Hadoop平台的Spark框架研究被引量：14

同被引文献53

引证文献14

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于Hadoop平台的Spark框架研究 被引量：14

同被引文献53

引证文献14

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于Hadoop平台的Spark框架研究被引量：14