基于Hadoop分布式文件系统的单点问题的研究被引量：2

Research on Problems of Single Point Based on Hadoop Distributed File System

下载PDF

导出

摘要从Hadoop分布式文件系统的架构出发,对Name Node节点存在的单点问题进行了分析与研究。在这个前提下,针对单点内存瓶颈问题,提出了一个小文件归并算法。此算法以Hadoop为基础,利用Hadoop分布式文件系统的特点,将归并后生成的大文件序列化到Hadoop分布式文件系统,很好地解决了小文件过多时Name Node单点内存瓶颈问题,并提高了系统的性能和可靠性。 Starting from the architecture of the Hadoop distributed file system,the problems of single point existed in the NameNode are analyzed and studied in this paper.Based on this,a small file merging algorithm is proposed for the single point memory bottlenecks.This algorithm,with Hadoop as the foundation and by the features of Hadoop distributed file system,serializes the generated large file to the Hadoop distributed file system,solves the problem of the single point memory bottlenecks,and improves the performance and reliability of the system.

作者宋继红李梦楠郝得智

机构地区沈阳工业大学

出处《软件工程师》 2014年第12期9-10,6,共3页 Software Engineer

关键词 HADOOP 小文件归并分布式文件系统 hadoop small files merging distributed file system

分类号 TP393.0 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Tom White,Hadoop.周敏齐,等,译.权威指南(第二版)[M].北京:清华大学出版社,2011.
2ChuckLam.Hadoop.韩冀中,译.实战[M].北京:人民邮电出版社.2011.
3雷万云,朱近之,薛峰,等.云计算:技术、平台及应用案例[M].北京:清华大学出版社,2011.
4The Apache Software Foundation HDFS ArchitectureGuide[EB/ OL].[2011-05-04].http://hadoop.apache.org/co-mmon/docs/ current/hdfs_design.html.
5DANIELN,RICH Wolski,CHRISG,etal.The Eucalyptus OpenSource Cloud-Computing System[J].IEEE Computer Society,2009,24(08):124-131.
6Venner J. Pro Hadoop[M]. New York:Apress,2009.
7Hadoop[EB/OL],http://hadoop.apache.org/.2011.
8Grant Mackey,Saba Sehrish,Jun Wang.Improving Metadata Management for Small Files in HDFS[J].IEEE International Conference on Cluster Computing and Workshops,2009:1-4.

共引文献4

1魏建琳.云计算的目标、架构及实现机制解析[J].西安文理学院学报（自然科学版）,2012,15(3):88-91. 被引量：1
2年瑞,符意德,葛二灵,周昆.一种基于云服务的远程诊断系统设计[J].计算机与数字工程,2012,40(10):166-168. 被引量：7
3陈文昭,李镜波,陈旭坤.中大型民营医院信息系统的云容灾与备份[J].现代医院,2013,13(8):145-147. 被引量：5
4郭利波,李厚明.基于云的呼叫中心系统探讨[J].中国新技术新产品,2013(21):23-23. 被引量：1

同被引文献5

1邹群.一种基于Hadoop的数字图书存储系统设计方案[J].黑龙江史志,2014(1). 被引量：1
2刘晓霞.Hadoop中大量小文件性能优化方法研究[J].计算机光盘软件与应用,2013,16(18):78-80. 被引量：3
3陈兴蜀,杨露,罗永刚.大数据安全保护技术[J].工程科学与技术,2017,49(5):1-12. 被引量：48
4陈磊,吴晓晖.基于Hadoop的分布式集群大数据动态存储系统设计[J].中国电子科学研究院学报,2019,14(6):593-598. 被引量：39
5郝志峰,黄泽林,蔡瑞初,傅正佳,温雯,唐凯麟.基于YARN的分布式资源动态调度与协同分配系统[J].计算机工程,2021,47(2):226-232. 被引量：7

引证文献2

1刘晓莉,李满,熊超,秦黄,刘晓娟.基于Hadoop搭建高可用数据仓库的研究和实现[J].现代信息科技,2023,7(1):99-101. 被引量：2
2王新东,王一大,李昌盛,张亚威,郭炜.基于混合架构的国产化大数据平台研究与应用[J].信息通信技术,2023,17(4):75-84. 被引量：1

二级引证文献3

1陈震宇,王华磊.邮储银行大数据基础软件自研探索和实践[J].中国金融电脑,2024(1):79-83.
2周少珂,郭璇,张振平,付媛冰.大数据Hadoop集群下Sqoop数据传输技术研究[J].河南科技,2024,51(6):25-28. 被引量：1
3张艳敏,马晓涛,杨冰倩,吴卫宏,赵滨.基于大数据技术的工业大数据高可用集群搭建设计与实现[J].无线互联科技,2024,21(22):48-51.

1贺建英.电子政务平台下HDFS中高效存储上传文件的方法[J].微型电脑应用,2015,31(8):76-79.
2王来,翟健宏.基于HDFS的分布式存储策略分析[J].智能计算机与应用,2016,6(1):5-8. 被引量：8
3司雅楠,阮宁.浅析基于HDFS的分布式Namenode模型[J].电脑知识与技术,2016,12(2X):239-241. 被引量：2
4徐欢欢,朱信忠,赵建民,徐慧英.基于Hadoop的优化海量录音小文件存取性能的方法[J].微型电脑应用,2015,31(2):1-3. 被引量：1
5王道兰.基于Ovation-XP的邯钢3200M^3高炉控制[J].可编程控制器与工厂自动化（PLC FA）,2011(12):94-96.
6闫纪红,王伟,李万召.搬运机械手性能监测系统开发[J].实验室研究与探索,2010,29(5):45-48. 被引量：3
7王卓,辛星,尹晓,常锦才.基于Hadoop的钢铁生产大数据存储平台研究[J].软件,2016,37(9):47-51. 被引量：3
8唐颖,刘国庆.基于Hadoop的云架构区域PACS存储方案设计[J].中国医疗设备,2013,28(8):47-50. 被引量：2
9马志强,杨双涛,闫瑞,张泽广.SQL-DFS:一种基于HDFS的海量小文件存储系统[J].北京工业大学学报,2016,42(1):134-141. 被引量：7
10康维维,左怀玉,钟志农.基于维扩展9交集矩阵的拓扑分析原型系统设计[J].兵工自动化,2007,26(6):44-46.

软件工程师

2014年第12期

浏览历史

内容加载中请稍等...

基于Hadoop分布式文件系统的单点问题的研究被引量：2

参考文献8

共引文献4

同被引文献5

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Hadoop分布式文件系统的单点问题的研究 被引量：2

参考文献8

共引文献4

同被引文献5

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Hadoop分布式文件系统的单点问题的研究被引量：2