基于Hadoop的大数据处理平台研究被引量：10

Study on big data processing platform based on Hadoop

下载PDF

导出

摘要大数据时代的到来伴随着海量数据,进而使得筛选出具有价值的信息成为大数据被广泛应用的核心步骤.在此情况下Apache Hadoop顺势而生,其通过简化数据密集、高度并行的分布式应用来应对大数据带来的挑战.由于目前基于Hadoop的大数据平台在多领域普遍使用,从而平台搭建成为进行大数据探索的第一步.而很多文章介绍的平台搭建是在虚拟机中完成,与真实情况存在相应差异.本文讨论以真实集群为基础搭建Hadoop平台的原因,Hadoop集群的强大功能,搭建平台所需设备、环境、安装、设置及测试过程. The age of big data is companied by massive data, making the selection of valuable information become a core step for wide usage of big data. Apache Hadoop is invented in this case and addressing the challenges from big data via simplifying data intensive and highly parallel distributed applications. The current big data based on Hadoop platform is widely used, so constructing a platform becomes the first step of exploration in big data. This paper describes the reason of Hadoop platform construct based on real cluster and the powerful function of Hadoop cluster as well as equipment, environment, installation, setting and testing process in the construction process.

作者朱颢东冯嘉美张志锋

机构地区郑州轻工业学院计算机与通信工程学院郑州轻工业学院软件学院

出处《华中师范大学学报（自然科学版）》 CAS 北大核心 2017年第5期585-590,共6页 Journal of Central China Normal University：Natural Sciences

基金河南省科技计划项目(152102210357 152102210149) 河南省高等学校青年骨干教师资助计划项目(2014GGJS-084) 河南省高等学校重点科研项目(16A520030) 郑州轻工业学院校级青年骨干教师培养对象资助计划项目(XGGJS02) 郑州轻工业学院博士科研基金资助项目(2010BSJJ038) 郑州轻工业学院研究生科技创新基金资助项目

关键词 HADOOP 大数据分布式应用 Hadoop dig data distributed application

分类号 TP393.0 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1周江,王伟平,孟丹,马灿,古晓艳,蒋杰.面向大数据分析的分布式文件系统关键技术[J].计算机研究与发展,2014,51(2):382-394. 被引量：74
2蒋云霞,符琦.基于Hadoop的云教学资源平台的研究[J].当代教育理论与实践,2016,8(4):111-113. 被引量：10
3刘艳俊,敖杰刚,徐齐行.基于MongoDB云计算下GML分布式集群环境搭建研究[J].测绘标准化,2012,28(1):3-5. 被引量：6
4崔文斌,牟少敏,王云诚,浩庆波,昌腾腾.Hadoop大数据平台的搭建与测试[J].山东农业大学学报（自然科学版）,2013,44(4):550-555. 被引量：18
5谭洁清,毛锡军.Hadoop云计算基础架构的搭建和hbase和hive的整合应用[J].贵州科学,2013,31(5):32-35. 被引量：14
6张岩,郭松,赵国海.基于Hadoop的云计算试验平台搭建研究[J].沈阳师范大学学报（自然科学版）,2013,31(1):85-89. 被引量：14

二级参考文献52

1崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
2冯幼乐,朱六璋.CEPH动态元数据管理方法分析与改进[J].电子技术（上海）,2010(9):1-3. 被引量：6
3熊劲,范志华,马捷,唐荣锋,李晖,孟丹.DCFS2的元数据一致性策略[J].计算机研究与发展,2005,42(6):1019-1027. 被引量：11
4王永杰,洪新兰,孙伟.基于并行空间数据库和GML的WebGIS系统的研究与实现[J].测绘科学,2007,32(4):131-132. 被引量：4
5教育部.国家中长期教育改革和发展规划纲要(2010-2020年)[EB/OL]. http ://news.xinhuanet.com/edu/2010-07/29/e_ 12389320_8.htm, 2011-03 -21.
6George L. ,2012. Hbase Authoritative Guide (Photocopy Edi- tion)[M]. Southeast University Press.
7GeorgeL.2012.Hbase权威指南(影印版)[M].东南大学出版社.
8TomWhite,2010.Hadoop权威指南(中文版)[M].清华大学出版社.
9Sandberg R,Goldberg D,Kleiman S. Design and implementation of the Sun network filesystem[A].Berkeley,CA:USENIX Association,1985.119-130.
10Shvachko K,Kuang H,Radia S. The Hadoop distributed file system[A].Piscataway,NJ:IEEE,2010.1-10.

共引文献128

1蒋云钟,冶运涛,赵红莉,梁犁丽,曹引,顾晶晶.水利大数据研究现状与展望[J].水力发电学报,2020,39(10):1-32. 被引量：84
2邸铮.MongoDB在煤炭行业GIS数据存储方面的应用[J].煤炭技术,2013,32(4):200-202. 被引量：5
3黄素萍,葛萌.Hadoop平台在大数据处理中的应用研究[J].现代计算机（中旬刊）,2013(10):12-15. 被引量：17
4缪新顿,莫子兴.HBase在机动车缉查布控系统中的应用[J].中国交通信息化,2014(5):123-125. 被引量：6
5周国军,吴庆军.使用VirtualBox和Hadoop搭建云计算虚拟实验平台[J].玉林师范学院学报,2014,35(2):113-118. 被引量：2
6梁海.MongoDB数据库中Sharding技术应用研究[J].计算机技术与发展,2014,24(7):60-62. 被引量：17
7杜卫华.浅析基于MongoDB的云数据管理技术的研究与应用[J].网络安全技术与应用,2014(8):89-89. 被引量：3
8石云,陈钟.基于协同神经网络的云通信异常检测方法[J].六盘水师范学院学报,2014,26(4):63-67. 被引量：2
9张尧,甘泉,刘建川.基于MongoDB的地理信息共享数据存储模型研究[J].测绘,2014,37(4):147-150. 被引量：8
10李扬威,焦朋朋,杜林.城市智能停车管理系统研究[J].交通信息与安全,2014,32(4):160-164. 被引量：38

同被引文献58

1王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：79
2覃雄派,王会举,杜小勇,王珊.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45. 被引量：386
3宋均,祝林.基于云计算的海量数据处理平台设计与实现[J].电讯技术,2012,52(4):566-570. 被引量：14
4孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2384
5郝斐,王雷,荆继武,王平建.基于CIFS协议的云存储安全网关的设计与实现[J].计算机应用与软件,2013,30(4):11-14. 被引量：5
6宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935. 被引量：538
7申德荣,于戈,王习特,聂铁铮,寇月.支持大数据管理的NoSQL系统研究综述[J].软件学报,2013,24(8):1786-1803. 被引量：194
8黄素萍,葛萌.Hadoop平台在大数据处理中的应用研究[J].现代计算机（中旬刊）,2013(10):12-15. 被引量：17
9张锋镝.学生机房中网络驱动器的映射方法与使用[J].内蒙古教育（C）,2014(2):50-50. 被引量：1
10何婕,赖敏.云计算平台中分布式Hadoop数据挖掘关键技术研究（英文）[J].机床与液压,2018,46(24):144-149. 被引量：10

引证文献10

1严亚宁.基于Hadoop的数据处理平台的设计与开发研究[J].现代信息科技,2019,3(3):5-7. 被引量：3
2张俊飞,吴小玲.数字化教学资源存储方案设计[J].实验室研究与探索,2019,38(4):115-118. 被引量：3
3李超.基于Hadoop的电力数据接入方案设计[J].江苏科技信息,2019,36(33):38-41. 被引量：3
4任培花,李健浩.基于大数据车辆模拟运行及日志收集仿真研究[J].计算机技术与发展,2020,30(2):197-201. 被引量：1
5李宝树,张凤佳,沈杨杨.面向电网的边缘算力优化与分布式数据存储处理模型研究[J].广东电力,2020,33(9):92-99. 被引量：12
6黄少聪.基于Hadoop的高校校园大数据平台构建[J].安徽电子信息职业技术学院学报,2021,20(1):10-13. 被引量：2
7罗利.基于Hadoop分布式集群搭建方法研究[J].科学技术创新,2021(7):99-100. 被引量：5
8翁晓俊,吴盼盼,夏冰沁.Hadoop无感滚动升级,支持业务连续性[J].中国金融电脑,2021(6):69-72.
9罗利.Hadoop集群实现词频统计应用[J].网络安全技术与应用,2021(6):64-65. 被引量：1
10莫继为.大数据背景下数据存储与分析新技术综述[J].计算机产品与流通,2018,7(5):163-165. 被引量：1

二级引证文献31

1张书贵,李文东.Linux环境下Hadoop部署模式分析[J].数字技术与应用,2024,42(3):140-142.
2张国斌,张叔禹,刘永江,郭瑞君.基于大数据与人工智能技术的电力在线技术监督平台建设方案[J].热力发电,2019,48(9):94-100. 被引量：38
3丁明庆.试论智能交通中大数据时代新技术的应用[J].技术与市场,2019,26(12):27-29.
4贺庆,王勇为,罗成彬,官晶(指导),朱华欣(指导).基于AI技术的游戏交易平台设计研究[J].信息通信,2020,0(1):83-84.
5陈本锋.教育公平视域下的数字化教学资源共建共享研究[J].广东技术师范大学学报,2020,41(2):17-23. 被引量：2
6黄伊玮,王立军,董一颍,衡反修.基于肿瘤大数据平台的DRG系统建设与应用研究[J].中国数字医学,2020,15(7):19-21. 被引量：4
7仲兆满,施珺,管燕.多异构信息网络融合的在线学习资源推荐[J].实验室研究与探索,2020,39(9):198-203. 被引量：3
8任璇炫.基于Hadoop的东盟电子商务平台的研究与设计[J].全国流通经济,2020(24):15-17. 被引量：1
9马跃,彭柏,韩大为,周巍.基于Kafka集群的物联微服务数据接入模式的研究[J].信息技术,2020,44(12):143-147. 被引量：5
10袁智勇,肖泽坤,于力,徐全,林跃欢,李培强,何西.智能电网大数据研究综述[J].广东电力,2021,34(1):1-12. 被引量：40

1丁明吉,杜彩玲,陈刚,张素梅.基于Oracle的分布式应用系统的设计与实现[J].计算机系统应用,1999,8(1):53-55.
2殷钟.使用JAVA开发CORBA分布式应用[J].中文信息（程序春秋）,2002(10):40-42.
3曾焱.基于COM+的分布式应用系统设计与部署[J].黄冈职业技术学院学报,2005,7(3):79-81. 被引量：1
4高多.项目教学法在高职英语教学中的辅助作用[J].教育发展研究,2017,37(S1):100-101. 被引量：7
5王东.原来是“你”——2017年广东中考作文题浅析[J].黄金时代（下半月）,2017,0(8):52-52.
6周夕崇.利用RMI实现JAVA分布式应用[J].电子与电脑,2000,7(5):123-127.
7岳海江.如何把作文指导融进日常语文教学[J].新课程研究（上旬）,2017,0(9):33-35.
8张秀珍,谈红,吴凤媛.江苏省跨境电商物流配送信息平台研究[J].江苏科技信息,2017,34(27):72-74. 被引量：1
9阳翔.基于反向推送的分布式应用自动化采集系统的研究与应用[J].电脑编程技巧与维护,2017(18):26-27.
10陆艳芳.稚化思维顺势而导深究错因构建真知[J].物理通报,2017,0(10):31-33.

华中师范大学学报（自然科学版）

2017年第5期

浏览历史

内容加载中请稍等...

基于Hadoop的大数据处理平台研究被引量：10

参考文献6

二级参考文献52

共引文献128

同被引文献58

引证文献10

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的大数据处理平台研究 被引量：10

参考文献6

二级参考文献52

共引文献128

同被引文献58

引证文献10

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于Hadoop的大数据处理平台研究被引量：10