基于Hadoop的云计算平台研究与实现被引量：10

Research and Implementation of Cloud Computing Platform Based on Hadoop

下载PDF

导出

摘要随着网络技术的发展,网络数据量正以指数级增长且规模日渐庞大。面对正在增长的海量数据,传统的数据处理方法存在效率低下等诸多缺点。人们需要一种新的技术思想来解决这些问题。因此,云计算的思想被提出。云计算是一种新兴的计算模型,是分布式计算技术的一种。而Hadoop作为一个开源的分布式平台是当前最为流行的云计算平台实现之一,被用于高效地处理海量数据。为了提高对海量数据处理的效率,文中首先简要分析了云计算的概念和Hadoop主要组件的工作流程,然后详细介绍了基于Hadoop的云计算平台配置方法和实现过程,并对云平台的搭建过程中遇到的典型问题进行了总结阐述。最后通过实验证明,该平台可以有效地完成分布式数据处理任务。 With the development of network technology,the number of online information is increasing in exponential and becoming larger and larger. With the growing amount of data,the traditional methods for processing massive data have many shortcomings like lowefficiency. A novel technology is needed to solve these problems,so the cloud computing has been brought. It is an emerging computational model,as a kind of distributed computing technology. Hadoop is one of the most popular cloud computing platforms as a kind of open sources distributed platform,which is always applied on the area that needs to handle massive data efficiently. In order to improve the efficiency of processing massive data,it briefly analyzes the concept of cloud computing and the work flowof the main components of Hadoop in this paper,then introduction of the implementation method of the cloud computing platform based on Hadoop in detail,discussion of the typical problems encountered in the process of building cloud computing platform. Finally,the experiments showthat the platform can effectively complete the processing tasks of distributed data.

作者范素娟田军锋

机构地区河南大学信息化管理办公室河南大学计算机与信息工程学院

出处《计算机技术与发展》 2016年第7期127-132,共6页 Computer Technology and Development

基金国家自然科学基金资助项目(61202098)

关键词 HADOOP HDFS MAPREDUCE 云计算 Hadoop HDFS MapReduce cloud computing

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1柯栋梁,郑啸,李乔.云计算:实例研究与关键技术[J].小型微型计算机系统,2012,33(11):2321-2329. 被引量：13
2林利,石文昌.构建云计算平台的开源软件综述[J].计算机科学,2012,39(11):1-7. 被引量：43
3Armbrust M, Fox A, Griffith R, et al. A view of cloud computing[J]. Communication of the ACM,2010,53(4) :50-58.
4王彦明,奉国和,薛云.近年来Hadoop国外研究综述[J].计算机系统应用,2013,22(6):1-5. 被引量：22
5Chaudhary A ,Singh P. Big data - importance of Hadoop distributed filesystem [ J ]. International Journal of Scientific & Engineering Research,2013,4 ( 11 ) : 234-237.
6Dean J, Ghemawat S. MapReduce: simplifier date processing on large clusters [ J ]. Communications of the ACM, 2008,51 (1):107-113.
7Berlinska J, Drozdowskib M. Scheduling divisible MapReduce computations [ J ].Parallel and Distributed Computing, 2011, 71 ( 3 ) :450-459.
8徐焕良,翟璐,薛卫,任守纲.Hadoop平台中MapReduce调度算法研究[J].计算机应用与软件,2015,32(5):1-6. 被引量：11
9Apache Hadoop [ EB/OL ]. 2015 - 08 - 07. http://hadoop. apache.org/.
10王婷娟,管会生,尹晖.DSA与RSA相结合的数字签名技术[C]//全国第19届(CACIS)学术会议论文集(下册).出版地不详:出版者不详,2008:1129-1133.

二级参考文献158

1刘俊.基于大数据流的Multi-Agent系统模型研究[J].计算机技术与发展,2007,17(5):166-169. 被引量：10
2王庆波,金漳,何乐,等.虚拟化与云计算[M].北京:电子工业出版社,2010.
3Bruce P. The Open Source Definition [C]//Open Sources: Voices from the Open Source Revolution. 1999:171-188.
4Wind S. Open Source Cloud Computing Management Platforms Introduction, Comparison, and Recommendations for Implemen- tation[C] // 2011 IEE[Conference on Open Systems (ICOS 2011). September 2011:175-179.
5Cerbelaud D, Garg S, Huylebroeck J. Opening The Clouds: Qua- litative Overview of the State-of-theart Open Source VM-based Cloud Management Platforms [C]// Proceedings of the 10th ACM/IF-IP/USENIX International Conference on Middleware. 2009 : 1-8.
6[CP Home Page[EB/OL]. http://vcww, enomaly, corn/, 2011.
7Eucalyptus Home Page [EB/OL]. http://www, eucalyptus corn/, 2011.
8OpenNebula Home Page [EB/OL]. http://vcww, opennebula. org/, 2 011.
9oVirt Home Page[EB/OL] http://www, ovirt, org/, 2011.
10Sempolinski P,Thain D. A Comparison and Critique of Eucalyp- tus,OpenNebula and Nimbus[C]//IEEE International Confe- rence on Cloud Computing Technology and Science. 2010:417-426.

共引文献339

1江永渡,程德生,赵志武,王梨,江峰.基于Spark框架的大数据计算平台[J].网络安全技术与应用,2020,0(3):65-66. 被引量：3
2宋宏雨,徐亚鹏,刘铁刚,李邦明.基于增强客户档位关注度来提升订货积极性的研究[J].中国产经,2020(10):117-118.
3谢月锋,董现垒,陈卉,王燕,刘志成.利用网络痕迹信息即时预测儿童腹泻流行趋势[J].医学信息（医学与计算机应用）,2016,29(29):1-4.
4刁海亭,郑成良,郑晓梅.云计算在蔬菜安全预警和追溯平台中的应用[J].山东农业大学学报（自然科学版）,2016,47(5):768-772.
5Beer.Super VCD制作DIY[J].光盘技术,2000(3):18-21.
6张岩,郭松,赵国海.基于Hadoop的云计算试验平台搭建研究[J].沈阳师范大学学报（自然科学版）,2013,31(1):85-89. 被引量：14
7杨宇菲.基于WOS数据库的国际云计算文献定量分析[J].西南民族大学学报（人文社会科学版）,2013,34(5):232-237. 被引量：4
8郭庆,姚敏.云计算在高校计算中心的应用探讨[J].软件导刊,2013,12(9):67-68. 被引量：1
9陈志高.Hadoop平台下一种改进蚂蚁算法的QoS路由[J].北华大学学报（自然科学版）,2013,14(5):617-620.
10陈志高.Hadoop平台下基于拥塞避免蚂蚁算法的QOS路由研究[J].石油工业计算机应用,2013(3):53-56.

同被引文献75

1王娟,石艳丽,姚立峰,王霞.地震勘探数据存储技术研究与应用[J].石油地球物理勘探,2008,43(S1):163-167. 被引量：9
2郑治真.我国前兆地声的观测与研究[J].地球物理学报,1994,37(A01):251-260. 被引量：13
3钱书清,任克新,吕智.伴随岩石破裂的VLF，MF，HF和VHF电磁辐射特性的实验研究[J].地震学报,1996,18(3):346-351. 被引量：72
4鄢锋,桂卫华,胡志坤,冯怀成.一种网络节点通信控制的心跳模型[J].信息与控制,2008,37(5):524-528. 被引量：18
5丁丹,倪四道,田晓峰,敬少群.地震相关的声音现象研究进展[J].华南地震,2010,30(2):46-53. 被引量：9
6万天翼.基于ITIL的运维管理系统的设计[J].数字技术与应用,2010,28(7):117-119. 被引量：23
7赵卫绩,刘井莲.基于FTP协议的客户端自动更新程序的设计与实现[J].科学技术与工程,2010,10(34):8591-8593. 被引量：12
8田秀霞,周耀君,毕忠勤,彭源.基于Hadoop架构的分布式计算和存储技术及其应用[J].上海电力学院学报,2011,27(1):70-74. 被引量：27
9潘震宇,卓群,刘仲达,杨婕,丁俊芳.水氡浓度和环境参数的分层神经网络研究[J].地震地磁观测与研究,2012,33(3):110-114. 被引量：1
10孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2378

引证文献10

1韩震,孙红.基于Hadoop的分布式平台实现[J].软件导刊,2017,16(3):56-58. 被引量：2
2刘士源.大数据和云计算平台的应用浅谈[J].科技风,2017(26):64-64. 被引量：2
3金秀如,雍珊珊,王新安,庞瑞涛,韩朝相,曾敬武.地震监测系统AETA的数据处理设计与实现[J].计算机技术与发展,2018,28(1):45-50. 被引量：5
4朱晓丽,邓惠俊,陈小虎.基于Hadoop云计算平台的数据处理研究[J].科技经济市场,2018(7):11-12. 被引量：1
5许景贤,郭建宏.基于Hadoop高校共享云平台实现方法与性能测试[J].九江学院学报（自然科学版）,2018,33(2):56-60. 被引量：1
6马刚,吕途.基于大数据HDFS改进的心跳模型[J].电脑与信息技术,2018,26(5):13-16.
7张恬恬,孙绍华.基于Spark的云计算平台在实验室的应用与实现[J].软件导刊,2018,17(4):191-193. 被引量：6
8鲁志芳.基于Hadoop技术的大数据分析应用系统的研究与设计[J].电子设计工程,2019,27(16):11-14. 被引量：13
9杨丹,张晶,赵骥,王刚.“分布式计算与开发模式”综合设计性实验案例[J].实验技术与管理,2019,36(10):197-200. 被引量：5
10杨河山,张世明,曹小朋,李春雷,姜兴兴.基于Hadoop分布式文件系统的地震勘探大数据样本采集及存储优化[J].油气地质与采收率,2022,29(1):121-127. 被引量：9

二级引证文献44

1张平.并行计算模型MapReduce的工作原理探究[J].吉林广播电视大学学报,2021(6):154-157. 被引量：3
2易心.CIS的意义与作用[J].湖南包装,2000,15(1):41-43.
3邹智敏.云平台应用教学及实践[J].电子技术与软件工程,2018(6):207-209.
4许景贤,郭建宏.基于Hadoop高校共享云平台实现方法与性能测试[J].九江学院学报（自然科学版）,2018,33(2):56-60. 被引量：1
5刘晨光,王新安,雍珊珊,徐伯星,张丹,周康生.AETA多分量地震监测系统的数据存储与安全系统[J].计算机技术与发展,2018,28(12):7-12. 被引量：2
6李柏杭,王新安,雍珊珊,徐伯星,黄继攀.人工免疫算法在AETA异常检测中的应用研究[J].计算机技术与发展,2019,29(3):1-5. 被引量：2
7邱景,李宜卓.基于Spark的大规模软件完整性校验行为识别框架[J].软件导刊,2019,18(4):46-49. 被引量：1
8贺释千,张海涛,李密生,王玉清.基于Spark云计算技术的Linux实验教学研究[J].中国教育信息化,2019,25(12):89-91. 被引量：4
9白茹.基于云计算和Hadoop的网络舆情监控系统设计[J].电子设计工程,2019,27(16):141-144. 被引量：9
10杨立君,郭林.面向云计算基础课程的Paxos算法教学设计研究[J].软件导刊,2019,18(10):191-194. 被引量：3

1郑秀颖,金玲.构件技术及其实现[J].沈阳工程学院学报（自然科学版）,2004(2):27-29. 被引量：2
2刘敏.基于RFID的物联网技术思想及应用[J].科技信息,2011(23):96-96. 被引量：1
3王龙.有关计算机数据库管理技术的探究[J].计算机光盘软件与应用,2012,15(18):143-144. 被引量：1
4戚克涛,汪良主,张申生.基于XML的Web应用研究[J].计算机工程,2002,28(1):65-66. 被引量：10
5段新昱.基于ODBC的VC++编程技术[J].燕山大学学报,2003,27(3):213-215. 被引量：1
6罗振刚.浅议计算机局域网的管理与安全[J].科技资讯,2008,6(24). 被引量：5
7陈远燕.浅谈如何保证计算机局域网的管理与安全[J].中国科教创新导刊,2009(14):157-157. 被引量：6
8张洁.云计算的发展前景以及安全问题[J].信息与电脑（理论版）,2012(1):25-26. 被引量：5
9张硕.物联网的技术思想与应用策略研究[J].通讯世界（下半月）,2016,0(5):67-67. 被引量：4
10李侠.物联网的技术思想与应用策略研究[J].今日科苑,2015,0(6):99-99. 被引量：1

计算机技术与发展

2016年第7期

浏览历史

内容加载中请稍等...

基于Hadoop的云计算平台研究与实现被引量：10

参考文献11

二级参考文献158

共引文献339

同被引文献75

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的云计算平台研究与实现 被引量：10

参考文献11

二级参考文献158

共引文献339

同被引文献75

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的云计算平台研究与实现被引量：10