基于Hadoop大数据集群的搭建被引量：3

Building Big Data Cluster Based on Hadoop

下载PDF

导出

摘要随着信息时代的到来和计算机技术的发展,各行各业的数据呈指数型增长。同时,大数据的快速发展在无时无刻影响着人们的生活。而对大数据的开发和处理成为当下信息时代的一大挑战,因此文章利用Hadoop生态体系构建一个完全分布式集群,利用分布式文件系统(HadoopDistributedFileSystem,HDFS)存储数据,利用MapReduce框架分布式处理数据分析任务,分析了搭建Hadoop系统所需的设备、环境、安装和设置等,为大数据实践提供了基础环境,也为下一步深层次理论研究提供技术依托。 With the arrival of the information age and the development of computer technology,the data of all walks of life show exponential growth.At the same time,the rapid development of big data affects people’s lives all the time.The development and processing of big data has become a major challenge in the current information age.Therefore,this paper uses the Hadoop ecosystem to build a fully distributed cluster,uses the Hadoop Distributed File System(HDFS)to store data,and uses the MapReduce framework to process data analysis tasks in a distributed manner.It analyzes the equipment,environment,installation and settings required for building the Hadoop system,It provides a basic environment for big data practice and a technical support for further in-depth theoretical research.

作者杨治学王静静 YANG Zhixue;WANG Jingjing(School of Information Engineering,Changji University,Changji Xinjiang 831100,China)

机构地区昌吉学院信息工程学院

出处《信息与电脑》 2022年第20期130-133,共4页 Information & Computer

关键词大数据 HADOOP 分布式计算分布式文件系统(HDFS) MAPREDUCE big data Hadoop distributed computing Hadoop Distributed File System(HDFS) MapReduce

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献24

1黄沾,邹大均.大数据集群管理系统设计与实现[J].通信技术,2019,52(1):146-151. 被引量：3
2陈磊,吴晓晖.基于Hadoop的分布式集群大数据动态存储系统设计[J].中国电子科学研究院学报,2019,14(6):593-598. 被引量：39
3王心宇,魏诗朦,陈韵秋.基于深度学习的传感器故障数据分析系统设计[J].计算机测量与控制,2020,28(6):266-270. 被引量：3
4林皓月,段华琼.基于Linux平台下的Hadoop和Spark集群搭建研究[J].电脑知识与技术,2020,16(23):207-208. 被引量：2
5郑海清.基于MongoDB的数据密集型云存储系统设计[J].电子设计工程,2021,29(1):106-109. 被引量：7
6黄为.基于大数据的安全传输及存储系统设计与实现分析[J].电脑知识与技术,2021,17(7):28-29. 被引量：2
7白浪,郑刚,郭媛,聂梦笛,张雄星,孙彬.高精度调频连续波光纤压力传感器温度特性分析及补偿方法[J].激光与光电子学进展,2021,58(9):393-401. 被引量：6
8周少珂,王雷,崔琳,郭璇,万小舟.大数据Hadoop技术完全分布式集群部署[J].工业控制计算机,2021,34(8):101-103. 被引量：18
9段晨辉,张小女.大数据时代传统关系数据库与NoSQL数据库的对比与分析[J].信息与电脑,2021,33(15):172-174. 被引量：7
10代劲,张磊,王国胤.基于云模型的煤矿安全大数据多粒度表示方法及应用[J].控制与决策,2021,36(10):2359-2368. 被引量：8

引证文献3

1杜啸楠,银莉.基于Linux的Hadoop数据集群平台教学实践[J].集成电路应用,2023,40(7):416-417. 被引量：1
2聂超,许伟娟,郝为建,常建.基于大数据技术的大型港口岸桥电耗分析[J].软件,2023,44(9):53-58.
3余少锋,钟建栩,席凌之,王悦晨.基于云计算和大数据技术的传感器数据存储与分析系统设计[J].电子设计工程,2024,32(18):105-109.

二级引证文献1

1陈震.Linux操作系统课程的教学实践[J].电子技术（上海）,2024,53(5):234-235.

1刘晓莉,李满,熊超,秦黄,刘晓娟.基于Hadoop搭建高可用数据仓库的研究和实现[J].现代信息科技,2023,7(1):99-101. 被引量：1
2郑江文,赵超.基于Flink的分布式推荐系统[J].信息与电脑,2022,34(19):108-112. 被引量：1
3吕立新,杨帆.基于Apriori算法与MapReduce优化模型的并行式数据聚类方法[J].九江学院学报（自然科学版）,2022,37(4):65-67. 被引量：4
4朱谞(文/图).大唐永盛:打造低空空管新“管家”[J].交通建设与管理,2022(5):92-92.
5张秀.基于Hadoop的数据挖掘算法研究[J].电子测试,2022,36(23):60-62. 被引量：1
6乔文豹,李宁,曾铮,梁旭.高校开源教育的发展与思考[J].软件导刊,2022,21(12):187-192.
7张丽君,曹蕾,鄂海燕,唐玲,郑乃花.中医护理技术在社区护理中的应用现状及思考[J].中西医结合护理,2022,8(4):26-30. 被引量：2
8岳远雷,徐着雨.医疗情感计算应用的多维困境及其法治实现[J].医学与哲学,2022,43(19):39-44. 被引量：8
9高飞.基于hadoop平台的数据挖掘算法实证研究[J].广西广播电视大学学报,2022,33(6):24-28.
10Gaelen P Adam,Robin Paynter,奚梓玮(译),高旭(译).证据合成文献检索策略的发展:结合文本挖掘工具和客观方法的利弊[J].英国医学杂志中文版,2022,25(12):732-734.

信息与电脑

2022年第20期

浏览历史

内容加载中请稍等...

基于Hadoop大数据集群的搭建被引量：3

同被引文献24

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Hadoop大数据集群的搭建 被引量：3

同被引文献24

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Hadoop大数据集群的搭建被引量：3