期刊文献+
共找到360篇文章
< 1 2 18 >
每页显示 20 50 100
分布式文件系统Hadoop HDFS与传统文件系统Linux FS的比较与分析 被引量:19
1
作者 许春玲 张广泉 《苏州大学学报(工科版)》 CAS 2010年第4期5-9,19,共6页
对现有HDFS的设计架构进行分析,并借与LinuxFS架构的对比凸显HDFS的分布式特性。通过分析得出:现有的HDFS架构使用Java的Map界面,不利于任务的分解和并行处理,因此HDFS仅在数据的存储上实现分布式,数据处理依然是集中式的,这就形成了对N... 对现有HDFS的设计架构进行分析,并借与LinuxFS架构的对比凸显HDFS的分布式特性。通过分析得出:现有的HDFS架构使用Java的Map界面,不利于任务的分解和并行处理,因此HDFS仅在数据的存储上实现分布式,数据处理依然是集中式的,这就形成了对NameNode的依赖,随着集群的扩大,NameNode的性能成为系统瓶颈,并提出了解决方向。 展开更多
关键词 hadoop hdfs hdfs BOTTLENECK 分布式文件系统
下载PDF
分布式文件系统HDFS处理小文件的优化方案 被引量:8
2
作者 杨彬 《软件》 2014年第6期65-69,共5页
Hadoop分布式文件系统(HDFS)是为可靠地存储和管理海量文件而设计。在HDFS中,所有的文件由单一的服务器NameNode来管理。因此,随着小文件数量的增加,会使HDFS系统性能下降。为了提高存储和访问HDFS上小文件的效率,本文提出了一个解决方... Hadoop分布式文件系统(HDFS)是为可靠地存储和管理海量文件而设计。在HDFS中,所有的文件由单一的服务器NameNode来管理。因此,随着小文件数量的增加,会使HDFS系统性能下降。为了提高存储和访问HDFS上小文件的效率,本文提出了一个解决方案,即:扩展的Hadoop分布式文件系统(EHDFS)。这种方法把一组相关文件组合成一个大文件来减少文件的数量,然后建立一种索引机制,从这个组合文件中识别并访问客户所要的单个文件。实验结果表明EHDFS提高了存储和访问大量小文件的效率。 展开更多
关键词 hadoop分布式文件系统(hdfs) 文件 扩展的hdfs(Ehdfs)
下载PDF
分布式文件系统在脉冲星数据处理中的应用
3
作者 刘懿德 于徐红 刘志杰 《信息技术与信息化》 2023年第3期70-73,共4页
随着500 m口径球面射电望远镜(fi ve hundred meters aperture spherical telescope,FAST)巡天扫描的数据量不断增加,现有分布式计算集群所采用的文件存储系统逐渐成为限制计算速度的瓶颈之一。通过对计算集群架构的分析,将脉冲星数据... 随着500 m口径球面射电望远镜(fi ve hundred meters aperture spherical telescope,FAST)巡天扫描的数据量不断增加,现有分布式计算集群所采用的文件存储系统逐渐成为限制计算速度的瓶颈之一。通过对计算集群架构的分析,将脉冲星数据处理与分布式文件系统技术相结合,针对目前计算集群中存在的问题,提出使用Alluxio+HDFS的分布式文件系统代替原先使用的Lustre文件系统,并根据脉冲星数据处理计算的特点和文件系统机制重新设计了任务分配算法和计算任务。实验表明使用该存储系统能够在相同的网络环境下提高网络带宽和节点内存利用率,减少网络传输时延及冗余磁盘读写开销,提高集群脉冲星数据处理的整体计算效率。 展开更多
关键词 脉冲星数据处理 分布式文件系统 Alluxio hdfs
下载PDF
面向Hadoop分布式文件系统的小文件存取优化方法 被引量:12
4
作者 李铁 燕彩蓉 +1 位作者 黄永锋 宋亚龙 《计算机应用》 CSCD 北大核心 2014年第11期3091-3095,3099,共6页
为提高Hadoop分布式文件系统(HDFS)的小文件处理效率,提出了一种面向HDFS的智能小文件存取优化方法——SmartFS。SmartFS通过分析小文件访问日志,获取用户访问行为,建立文件关联概率模型,并根据基于文件关联关系的合并算法将小文件组装... 为提高Hadoop分布式文件系统(HDFS)的小文件处理效率,提出了一种面向HDFS的智能小文件存取优化方法——SmartFS。SmartFS通过分析小文件访问日志,获取用户访问行为,建立文件关联概率模型,并根据基于文件关联关系的合并算法将小文件组装成大文件之后存至HDFS;当从HDFS获取文件时,根据基于文件关联关系的预取算法来提高文件访问效率,并提出基于预取的缓存替换算法来管理缓存空间,从而提高文件的命中率。实验结果表明,SmartFS有效减少了HDFS中NameNode的元数据空间,减少了用户与HDFS的交互次数,提高了小文件的存储效率和访问速度。 展开更多
关键词 hadoop分布式文件系统 文件 文件关联 预取 缓存
下载PDF
Hadoop分布式文件系统的模型分析 被引量:22
5
作者 王峰 雷葆华 《电信科学》 北大核心 2010年第12期95-99,共5页
Hadoop分布式文件系统是遵循Google文件系统原理进行开发和实现的,受到了业界极大关注,并已被广泛应用。鉴于当前缺乏从系统设计理论的角度对其开展的相关研究,本文从Hadoop分布式文件系统架构的建模入手,通过对模型各组成部分进行分析... Hadoop分布式文件系统是遵循Google文件系统原理进行开发和实现的,受到了业界极大关注,并已被广泛应用。鉴于当前缺乏从系统设计理论的角度对其开展的相关研究,本文从Hadoop分布式文件系统架构的建模入手,通过对模型各组成部分进行分析,并将其与传统的分布式文件系统进行比较,总结出Hadoop分布式文件系统具有的海量、高可扩展性、高可靠性、高性能等面向云计算领域应用的重要特征。本文有助于研究者系统、深入地研究Hadoop分布式文件系统的设计与实现,并为云计算背景下的分布式文件系统设计提供重要的参考。 展开更多
关键词 hadoop分布式文件系统 系统模型 云计算
下载PDF
大数据环境下hadoop分布式文件系统分散式动态副本存储优化策略研究 被引量:7
6
作者 杨莲 郭良君 +1 位作者 马磊 王圣芳 《中国医院统计》 2019年第1期75-78,共4页
在不影响hadoop分布式文件系统分散式存储结构的前提下,结合动态副本存储和伽罗华有限域理论对范德蒙码的计算方法和计算模式进行整体优化,降低了编译码的时间代价和计算的内存压力,节约了hadoop分布式文件系统约35%的存储开销,提高了ha... 在不影响hadoop分布式文件系统分散式存储结构的前提下,结合动态副本存储和伽罗华有限域理论对范德蒙码的计算方法和计算模式进行整体优化,降低了编译码的时间代价和计算的内存压力,节约了hadoop分布式文件系统约35%的存储开销,提高了hadoop分布式文件系统节点负载均衡能力和译码恢复效率。这种算法更适合于医疗专业文书的处理,解决临床科研需求和数据供给2个方面的问题。既能节省了存储容量,可以容纳与日俱增且越发复杂化的医疗数据,又能降低硬件服务器成本,为医院节省资金开销,更能快速查询获取数据池中的有效数据,让这些躺着的数据变成活的,充分发挥他们的临床使用价值和科研价值。这一套完整的、系统的优化方案,为未来hadoop分布式文件系统的发展提供了一条有效途径。 展开更多
关键词 hadoop分布式文件系统 云存储 动态副本 策略 大数据
下载PDF
分布式文件系统HDFS的分析 被引量:1
7
作者 朱颂 《福建电脑》 2012年第4期63-65,共3页
越来越多的开源社区和大型公司都对分布式文件系统HDFS进行支持和改进,使HDFS在大规模数据存储领域的研究价值突显。文章从HDFS的架构出发,对其数据管理的方式进行了分析,最后从源代码角度阐述了读写数据的具体过程。
关键词 分布式 hdfs GOOGLE FILE System hadoop
下载PDF
一种分布式文件系统—HDFS 被引量:1
8
作者 张丽媛 《电脑编程技巧与维护》 2016年第21期11-13,19,共4页
随着互联网数据规模呈剧增趋势,在需要存储文件的时候就要求文件系统具有更大的容量、更好的性能以及更高的安全性。因为HDFS分布式文件系统通过网络相连存在着大量的节点(用于存储元数据及文件数据),这使得HDFS分布式文件系统的设计实... 随着互联网数据规模呈剧增趋势,在需要存储文件的时候就要求文件系统具有更大的容量、更好的性能以及更高的安全性。因为HDFS分布式文件系统通过网络相连存在着大量的节点(用于存储元数据及文件数据),这使得HDFS分布式文件系统的设计实现的难度和复杂度增大。针对这些问题重点研究HDFS分布式文件系统的系统架构及文件读写过程。 展开更多
关键词 分布式文件系统 hdfs系统 文件存储 名字节点 数据节点
下载PDF
基于Hadoop分布式文件系统的单点问题的研究 被引量:2
9
作者 宋继红 李梦楠 郝得智 《软件工程师》 2014年第12期9-10,6,共3页
从Hadoop分布式文件系统的架构出发,对Name Node节点存在的单点问题进行了分析与研究。在这个前提下,针对单点内存瓶颈问题,提出了一个小文件归并算法。此算法以Hadoop为基础,利用Hadoop分布式文件系统的特点,将归并后生成的大文件序列... 从Hadoop分布式文件系统的架构出发,对Name Node节点存在的单点问题进行了分析与研究。在这个前提下,针对单点内存瓶颈问题,提出了一个小文件归并算法。此算法以Hadoop为基础,利用Hadoop分布式文件系统的特点,将归并后生成的大文件序列化到Hadoop分布式文件系统,很好地解决了小文件过多时Name Node单点内存瓶颈问题,并提高了系统的性能和可靠性。 展开更多
关键词 hadoop 文件归并 分布式文件系统
下载PDF
Hadoop分布式文件系统原理 被引量:3
10
作者 曹卉 《软件导刊》 2016年第3期15-17,共3页
Hadoop分布式文件系统在大规模存储和访问中具有广阔的应用空间。从基本概念、基本结构、元数据管理、数据存储、文件管理、数据容错6个方面对HDFS的实现原理进行了探究,可为HDFS应用研究奠定基础。
关键词 hdfs hadoop分布式文件系统 信息存储
下载PDF
基于Hadoop分布式文件系统的模型分析 被引量:1
11
作者 郭强 《电脑知识与技术(过刊)》 2016年第6X期229-230,233,共3页
Hadoop分布式文件系统利用Google文件系统的原理开发和设计的,并在相关的一些领域得到了应用,在学界引起了极大的关注。本文将从Hadoop分布式文件系统架构的入手,通过对模型各模块进行分析,并将其与传统的分布式文件系统进行比较,总结出... Hadoop分布式文件系统利用Google文件系统的原理开发和设计的,并在相关的一些领域得到了应用,在学界引起了极大的关注。本文将从Hadoop分布式文件系统架构的入手,通过对模型各模块进行分析,并将其与传统的分布式文件系统进行比较,总结出Hadoop分布式文件系统具有的海量、可靠性高、可扩展性、容错性能好、低成本等面向云计算领域的重要优势。Hadoop能为用户提供一个可以轻松使用的分布式计算平台,使用户可以轻松地在该平台上开发应用程序并能够处理海量数据,本文通过对布式文件系统的模型分析将有助于云计算背景下的分布式文件系统设计与开发。 展开更多
关键词 基于hadoop分布式文件系统 系统模型 云计算
下载PDF
基于HDFS分布式文件系统的大数据存储优点与功能
12
《科学大众(科技创新)》 2018年第1期4-5,共2页
信息时代,人们在生活和工作中产生了大量数据。然而,随着数据越来越多,数据信息规模不断产生。传统的操作系统很难将这些体积庞大的数据快速、安全、稳定地存储起来。尽管有的研究者考虑过把这些数据进行拆分,并分配到更多的操作系统管... 信息时代,人们在生活和工作中产生了大量数据。然而,随着数据越来越多,数据信息规模不断产生。传统的操作系统很难将这些体积庞大的数据快速、安全、稳定地存储起来。尽管有的研究者考虑过把这些数据进行拆分,并分配到更多的操作系统管理的磁盘中,以实现无限的数据存储。但是这种存储方式十分不便于管理和维护,因此,迫切需要一种更加先进的存储管理系统来管理多台机器上的文件,这就是本文研究的分布式文件管理系统。本文探讨了基于HDFS分布式文件系统的大数据存储的优点与功能,并介绍了依托HDFS分布式文件系统卓越的性能开展海量数据存储服务以及衍生服务的企业和研究机构,进而探究其借助这一重要工具实现业务水平快速升级的策略。 展开更多
关键词 hdfs 分布式文件系统 大数据 hadoop
下载PDF
基于新型存储器件的分布式文件系统性能优化 被引量:6
13
作者 董聪 张晓 +1 位作者 程文迪 石佳 《计算机应用》 CSCD 北大核心 2020年第12期3594-3603,共10页
新型存储器件的I/O性能通常比传统固态驱动器(SSD)高一个数量级,然而使用新型存储器件的分布式文件系统相对于使用SSD的分布式文件系统性能并没有显著的提高,这说明目前的分布式文件系统并不能充分发挥新型存储器件的性能。针对这个问题... 新型存储器件的I/O性能通常比传统固态驱动器(SSD)高一个数量级,然而使用新型存储器件的分布式文件系统相对于使用SSD的分布式文件系统性能并没有显著的提高,这说明目前的分布式文件系统并不能充分发挥新型存储器件的性能。针对这个问题,对Hadoop分布式文件系统(HDFS)的数据写入流程及传输过程进行了量化分析。通过量化分析HDFS数据写入过程各阶段的时间开销,发现在写入数据的各个阶段中,节点间数据传输的时间占比较大。因此提出了对应的优化方案,通过异步写入的方式并行化数据传输与处理过程,使得不同数据包的处理阶段叠加起来,减少了数据包整体的处理时间,从而提升了HDFS的写入性能。实验结果表明,所提方案将HDFS的写入吞吐量提升了15%~24%,总体的写入执行时间降低了28%~36%。 展开更多
关键词 分布式文件系统 hadoop分布式文件系统 非易失性存储器 性能优化 异步写入
下载PDF
面向搜索引擎的分布式文件系统性能分析 被引量:12
14
作者 董守斌 赵铁柱 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第4期7-14,共8页
搜索引擎是一种数据密集型应用,其性能极大依赖于底层文件系统的性能.文中主要讨论分布式文件系统在搜索引擎应用环境下的性能评估和性能优化问题.首先概述了分布式文件系统的性能影响因素及相关研究进展;在此基础上提出基于Hadoop的开... 搜索引擎是一种数据密集型应用,其性能极大依赖于底层文件系统的性能.文中主要讨论分布式文件系统在搜索引擎应用环境下的性能评估和性能优化问题.首先概述了分布式文件系统的性能影响因素及相关研究进展;在此基础上提出基于Hadoop的开放架构,系统地评估HDFS和Lustre在搜索引擎应用场景下的性能;最后针对实验评估发现的HDFS在写性能及小文件数据处理方面的不足,提出改进方案,为搜索引擎的分布式文件系统优化提供参考. 展开更多
关键词 搜索引擎 分布式文件系统 hdfs文件系统 LUSTRE文件系统 性能分析 性能优化
下载PDF
一种面向分布式文件系统的文件预取模型的设计与实现 被引量:2
15
作者 师明 刘轶 唐歌实 《计算机科学》 CSCD 北大核心 2014年第7期30-35,共6页
如何为上层应用和计算提供稳定高效的文件I/O性能,是分布式文件系统性能研究的热点。文中分析分布式文件系统在设计机理上的共同特征,基于此提出一种通用型的启发式文件预取模型,并选取HDFS平台进行系统实现。启发式文件预取对上层应用... 如何为上层应用和计算提供稳定高效的文件I/O性能,是分布式文件系统性能研究的热点。文中分析分布式文件系统在设计机理上的共同特征,基于此提出一种通用型的启发式文件预取模型,并选取HDFS平台进行系统实现。启发式文件预取对上层应用透明,采用在文件系统内部建立预取线程池的方法,以组成文件块的数据存储文件为预取单位,在分布式文件系统内部实现。这种设计思路具有一定的普适性,适合推广应用于多种分布式文件系统。实验结果表明,所述的启发式文件预取,能够有效提升分布式文件系统的I/O性能。 展开更多
关键词 分布式文件系统 文件预取 启发式 hdfs
下载PDF
基于P2P的分布式文件系统下载效率优化 被引量:2
16
作者 廖彬 于炯 +1 位作者 张陶 杨兴耀 《计算机应用》 CSCD 北大核心 2011年第9期2317-2320,2328,共5页
对分布式文件系统(HDFS)集群内部数据块存储机制与下载流程进行分析研究,结合P2P多点与多线程下载思想,从数据块、文件、集群三个方面提出了数据下载效率优化算法。考虑到集群内部可能因多线程下载出现的负载均衡问题,提出下载点选择算... 对分布式文件系统(HDFS)集群内部数据块存储机制与下载流程进行分析研究,结合P2P多点与多线程下载思想,从数据块、文件、集群三个方面提出了数据下载效率优化算法。考虑到集群内部可能因多线程下载出现的负载均衡问题,提出下载点选择算法以优化下载点的选择。实验结果表明,三种优化算法都能提高下载效率,下载点选择算法能够很好地实现集群内部DataNode负载均衡。 展开更多
关键词 云计算 分布式文件系统 对等网 并行下载 负载均衡
下载PDF
Cumulus:一个基于网络编码的分布式文件系统 被引量:1
17
作者 陈运海 陈正亮 +1 位作者 王钦辉 叶保留 《微电子学与计算机》 CSCD 北大核心 2012年第9期74-78,共5页
基于网络编码在并发式数据传输时能够有效地降低网络负载的优越性,应用网络编码优化分布式文件系统的容错问题得到了广泛的关注.为了研究网络编码在分布式文件系统中的应用及其在降低网络负载的有效性,文中基于开源的Hadoop项目设计并... 基于网络编码在并发式数据传输时能够有效地降低网络负载的优越性,应用网络编码优化分布式文件系统的容错问题得到了广泛的关注.为了研究网络编码在分布式文件系统中的应用及其在降低网络负载的有效性,文中基于开源的Hadoop项目设计并实现了面向网络编码的分布式文件系统.该系统通过对存储文件进行切分,然后将这些文件切片进行编码存储,能够以更小的冗余开销获得更好的容错性能,同时,能够利用网络编码的性能提高网络资源利用率. 展开更多
关键词 网络编码 分布式文件系统 冗余容错 hadoop 网络资源利用率
下载PDF
基于Hadoop分布式文件系统的分析与研究 被引量:6
18
作者 王跃 《计算机光盘软件与应用》 2011年第9期161-162,共2页
通过对HDFS(Hadoop的一个分布式文件系统)以及Map/Reduce数据驱编程模型和HBase分布式的、列存储数据库和Hive分布式数据仓库的分析。可以得到Had00p的优势在于能以批处理模式处理PB级以上的数据集,适合做离线的数据分析,不适合实... 通过对HDFS(Hadoop的一个分布式文件系统)以及Map/Reduce数据驱编程模型和HBase分布式的、列存储数据库和Hive分布式数据仓库的分析。可以得到Had00p的优势在于能以批处理模式处理PB级以上的数据集,适合做离线的数据分析,不适合实时响应需求,如股票系统。客户端是打包成JAR文件形式,运行于Hadoop命令行界面,可以定制执行策略,当数据到来的时候运行Map/Reduce程序,可以手动执行也可以定时执行。可以用Map/Reduce作为BI等海量数据分析平台的分布式数据处理引擎,HDFS作为底层存储文件系统。 展开更多
关键词 hadoop MAP/REDUCE hdfs 云计算
下载PDF
分布式文件系统的文件访问处理、安全访问方法及装置 被引量:6
19
作者 刘勇 陆小慧 《广东通信技术》 2018年第3期69-75,共7页
本文研究并提供了一种分布式文件系统的文件访问处理、安全访问方法及装置。其中访问处理方法包括:获取对分布式文件系统内部文件中待加密的文件信息;对文件信息指示的文件和文件所属目录中至少之一所对应的访问过程进行加密,和/或对所... 本文研究并提供了一种分布式文件系统的文件访问处理、安全访问方法及装置。其中访问处理方法包括:获取对分布式文件系统内部文件中待加密的文件信息;对文件信息指示的文件和文件所属目录中至少之一所对应的访问过程进行加密,和/或对所述文件信息指示的文件本身进行加密。采用本文提供的上述技术方案,解决了已有技术中,分布式文件系统中因无鉴权机制导致文件访问存在安全隐患等技术问题,从而增强了分布式文件系统中文件访问的安全性。 展开更多
关键词 分布式文件系统 访问处理 访问加密 hdfs
下载PDF
云计算中的分布式文件系统 被引量:1
20
作者 郎为民 杨德鹏 《电信快报(网络与通信)》 2012年第2期3-6,24,共5页
云计算是一种基于互联网提供服务的业务模式,它能够实现IT基础设施的资源化和服务化,用户可以按需进行定制和付费,从而彻底改变了传统IT基础设施的提供和支付方式,有效解决了无限增长的海量信息存储和计算问题。文章给出了云计算分布式... 云计算是一种基于互联网提供服务的业务模式,它能够实现IT基础设施的资源化和服务化,用户可以按需进行定制和付费,从而彻底改变了传统IT基础设施的提供和支付方式,有效解决了无限增长的海量信息存储和计算问题。文章给出了云计算分布式文件系统的主要类型,分析了Google文件系统(GFS)和Hadoop分布式文件系统(HDFS)的演进情况。最后,详细描述了分布式文件系统的工作原理。 展开更多
关键词 云计算 分布式文件系统 Google文件系统(GFS) hadoop分布式文件系统(hdfs)
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部