期刊文献+
共找到405篇文章
< 1 2 21 >
每页显示 20 50 100
基于Hadoop平台的分布式文件云存储系统设计
1
作者 袁宏涛 《软件》 2024年第6期172-174,共3页
数据量的激增促进了分布式文件系统的迅速发展,Hadoop作为一个开源框架,以其高效的数据存储与处理能力在分布式系统中占据重要地位。通过Hadoop Distributed File System(HDFS)实现大规模数据集的分布式存储,YARN为资源管理提供了弹性调... 数据量的激增促进了分布式文件系统的迅速发展,Hadoop作为一个开源框架,以其高效的数据存储与处理能力在分布式系统中占据重要地位。通过Hadoop Distributed File System(HDFS)实现大规模数据集的分布式存储,YARN为资源管理提供了弹性调度,使得Hadoop成为处理大数据问题的理想平台。本文探讨了基于Hadoop平台的分布式文件云存储系统设计,旨在提供一种高效可靠的分布式文件云存储解决方案,以支持大数据时代下的数据存储与处理需求。 展开更多
关键词 HADOOP平台 分布式文件云存储系统 系统设计
下载PDF
基于大数据的分布式文件存储系统架构设计
2
作者 杨明 《信息记录材料》 2024年第4期177-179,共3页
针对目前数据量庞大对文件存储的需求激增,本文研究基于大数据的分布式文件存储系统(Hadoop distributed file system,HDFS)架构设计。通过分析HDFS架构的基本原理,讨论数据分布策略、数据备份与恢复机制以及一致性与性能优化的方法,提... 针对目前数据量庞大对文件存储的需求激增,本文研究基于大数据的分布式文件存储系统(Hadoop distributed file system,HDFS)架构设计。通过分析HDFS架构的基本原理,讨论数据分布策略、数据备份与恢复机制以及一致性与性能优化的方法,提出针对名称节点和数据节点的改进措施,包括在名称节点中引入高速闪存驱动器以管理元数据,并在数据节点中实施元数据缓存机制。研究结果表明:分布式文件存储系统可以优化元数据管理,减少网络成本,并提高系统性能,对改善大数据存储系统的性能具有重要作用。 展开更多
关键词 大数据 分布式文件存储 文件存储系统设计
下载PDF
基于云平台的企业远程办公文件分布式存储方法
3
作者 张脉琪 《自动化技术与应用》 2024年第3期112-115,共4页
为提高数据的读写性能,设计基于云平台的企业远程办公文件分布式存储方法。总体架构由计算层、数据接入层、存储层、数据聚集层构成。存储层由Hadoop集群构成,各集群由NameNode管理;计算层与数据接入层可以实现数据的持久化存储;数据聚... 为提高数据的读写性能,设计基于云平台的企业远程办公文件分布式存储方法。总体架构由计算层、数据接入层、存储层、数据聚集层构成。存储层由Hadoop集群构成,各集群由NameNode管理;计算层与数据接入层可以实现数据的持久化存储;数据聚集层采用一致性多副本哈希存储算法作为数据聚集算法。通过搭建虚拟化云平台统一管理多个服务器,创建主机虚拟集群。设计文件加解密过滤器进行数据加解密。设计随机化数据冗余算法进行数据冗余。测试结果表明设计方法的集群负载情况良好,读、写带宽最高达到3798 bps和3912 bps,读、写速率最高达到3298字节/s和3258字节/s。 展开更多
关键词 平台 企业远程办公 HDFS文件 文件分布式存储 数据聚集
下载PDF
基于HDFS分布式云存储系统的重复数据检测与删除研究
4
作者 王储 《电脑编程技巧与维护》 2024年第1期92-95,共4页
传统最远点采样(FPS)算法、数据类型分析(WFC)算法的去重冗余度高,在同一数据集分块、去重检测中的数据重复率达到70~90%。基于这一实际情况,提出基于Hadoop分布式软件框架、分布式文件系统(HDFS)等云服务技术,建构用于复杂数据结构分... 传统最远点采样(FPS)算法、数据类型分析(WFC)算法的去重冗余度高,在同一数据集分块、去重检测中的数据重复率达到70~90%。基于这一实际情况,提出基于Hadoop分布式软件框架、分布式文件系统(HDFS)等云服务技术,建构用于复杂数据结构分析、数据分块去重的HDFS-SDBS云存储管理系统,使用基于文件相似度的抽样删除索引(SDBS)算法进行文件数据分块、哈希值(Hash)计算、随机抽样的相似度判定,利用元数据索引查重方式完成输入文件数据、内存数据的比对,删除相似度过高的重复数据,以提升云环境下的数据存储效率与准确率。 展开更多
关键词 HDFS-SDBS 分布式存储系统 重复数据检测 删除
下载PDF
基于云计算技术的分布式存储系统数据传输功能优化
5
作者 兰晓天 《数字通信世界》 2024年第9期69-71,共3页
针对分布式存储系统在云计算环境中数据传输效率低下及存储空间率利用不足的问题,该文提出了一种基于数据去重技术的优化方法。这一方法通过识别并消除存储过程中的冗余数据,有效提高了数据传输的效率并节约了存储空间。采用该方法系统... 针对分布式存储系统在云计算环境中数据传输效率低下及存储空间率利用不足的问题,该文提出了一种基于数据去重技术的优化方法。这一方法通过识别并消除存储过程中的冗余数据,有效提高了数据传输的效率并节约了存储空间。采用该方法系统将上传的文件分块,并为每个块生成唯一的哈希值以进行快速比对。通过去重检查,系统能够识别出重复的数据块,从而避免了重复存储和传输,显著减少了数据中心的负载。对于新的数据块,则进行存储并更新索引,以支持高效的数据检索。实验结果表明,使用数据去重技术能够在保持数据完整性的同时,显著提高数据传输的速率和存储系统的整体性能。综上所述,该文不仅提出了一种有效的分布式存储系统优化方案,也为云计算环境下的数据管理提供了新的思路。 展开更多
关键词 分布式存储系统 数据去重 计算优化
下载PDF
基于云计算的分布式存储系统文件传输优化 被引量:1
6
作者 梁浩 周娟 +1 位作者 王辉华 陈龙 《自动化技术与应用》 2023年第5期108-110,共3页
针对传统方法在传输文件时传输效率过低的问题,文中提出了云计算平台下分布式存储系统文件传输自动优化方法。通过将大小不同的文件放入相应的传输通道中,实现了文件传输最优路径自动选择。利用对服务器缓冲区大小分做出具体的分析计算... 针对传统方法在传输文件时传输效率过低的问题,文中提出了云计算平台下分布式存储系统文件传输自动优化方法。通过将大小不同的文件放入相应的传输通道中,实现了文件传输最优路径自动选择。利用对服务器缓冲区大小分做出具体的分析计算,进行最优匹配,提高传输速率。通过仿真实验结果表明,文中方法较传统方法相比,有着较高的传输速率和性能,实现了文件的自动分类和传输的自动优化。 展开更多
关键词 计算平台 分布式存储系统 文件传输
下载PDF
Python语言的分布式共享系统设计
7
作者 赵伟霞 《数字技术与应用》 2024年第4期105-107,共3页
随着云计算、大数据及物联网技术的迅猛发展,分布式系统通过网络将多个计算节点连接起来,共同完成计算任务,提高了系统的处理能力和数据存储能力。Python语言以其简洁的语法、强大的库支持和广泛的社区资源,能够实现复杂的系统功能,成... 随着云计算、大数据及物联网技术的迅猛发展,分布式系统通过网络将多个计算节点连接起来,共同完成计算任务,提高了系统的处理能力和数据存储能力。Python语言以其简洁的语法、强大的库支持和广泛的社区资源,能够实现复杂的系统功能,成为开发分布式共享系统的理想选择。因此,本文将探讨Python语言的分布式共享系统的设计,以期为分布式系统的理论研究与实践应用提供理论参考。 展开更多
关键词 PYTHON语言 分布式系统 计算 大数据 物联网技术 数据存储能力 节点连接 分布式共享
下载PDF
基于HBase的分布式海量小型文件存储系统 被引量:1
8
作者 秦栋华 《数字通信世界》 2023年第4期74-75,79,共3页
随着互联网公司的业务不断发展,企业的大量数据以非结构化的形式存在,非结构化数据常常以小型文件为主,不仅体量大,而且分散性高,因此海量小型文件存储面临着存储性能和访问效率较低等问题。分布式小型文件存储系统是指在集群服务器的... 随着互联网公司的业务不断发展,企业的大量数据以非结构化的形式存在,非结构化数据常常以小型文件为主,不仅体量大,而且分散性高,因此海量小型文件存储面临着存储性能和访问效率较低等问题。分布式小型文件存储系统是指在集群服务器的硬件存储资源环境下,对小型文件保存、读取和修改进行统一管理的系统。文章基于HBase实现了一个分布式小型文件存储系统,该文件系统有超强的处理海量小型文件的能力,同时有着良好的扩展性、容错性和稳定性,可以更好地支撑互联网企业的业务发展。 展开更多
关键词 分布式 HBASE 文件系统 存储
下载PDF
云存储及其分布式文件系统研究 被引量:8
9
作者 邓见光 潘晓衡 袁华强 《东莞理工学院学报》 2012年第5期41-46,共6页
云存储专注于解决云计算系统中海量数据文件的存储问题;文件系统用来管理大量的文件信息,并负责对文件的存储空间进行组织分配;分布式文件系统不仅要管理本地计算机的数据文件,同时还要管理整个存储系统中的数据文件。文章首先对云计算... 云存储专注于解决云计算系统中海量数据文件的存储问题;文件系统用来管理大量的文件信息,并负责对文件的存储空间进行组织分配;分布式文件系统不仅要管理本地计算机的数据文件,同时还要管理整个存储系统中的数据文件。文章首先对云计算技术进行介绍,然后引出云存储的概念,并通过对云存储的技术原理、性能优势等进行分析,指出分布式文件系统对于云存储技术的重要性;最后对现有的云存储分布式文件系统进行详细论述。全文工作将指导我们进一步深入研究云存储技术。 展开更多
关键词 计算 存储 分布式文件系统
下载PDF
基于云平台的大规模分布式存储系统的构建
10
作者 谢佐伟 《中文科技期刊数据库(文摘版)工程技术》 2023年第5期1-3,共3页
基于云平台提出了一种的大规模分布式存储系统解决方案。随着云计算技术的发展,越来越多的企业尝试使用云存储技术,本文结合传统HDFS和分布式文件系统的优势,提出了基于云平台的大规模分布式存储系统结构和实现方法,为构建具有高性能、... 基于云平台提出了一种的大规模分布式存储系统解决方案。随着云计算技术的发展,越来越多的企业尝试使用云存储技术,本文结合传统HDFS和分布式文件系统的优势,提出了基于云平台的大规模分布式存储系统结构和实现方法,为构建具有高性能、可扩展性、安全性和稳定性的云存储服务提供新的思路。本文提出的大规模分布式存储方案具有高性能、可扩展性、安全性和稳定性,能够为企业提供高效、可靠、经济、安全的云存储服务。 展开更多
关键词 平台 分布式存储系统 构建
下载PDF
基于FastDFS分布式文件存储系统的设计与实现
11
作者 李改平 《中国科技期刊数据库 工业A》 2023年第7期1-5,共5页
FastDFS是一款轻量级的开源分布式文件存储系统,专为存储中小型文件而设计,充分考虑文件系统所需性能、并发、扩展等需求,对FastDFS架构分析后,提出一组利用本地数据库存储远程文件的源服务器地址的方法,设计多节点部署,为实现文件系统... FastDFS是一款轻量级的开源分布式文件存储系统,专为存储中小型文件而设计,充分考虑文件系统所需性能、并发、扩展等需求,对FastDFS架构分析后,提出一组利用本地数据库存储远程文件的源服务器地址的方法,设计多节点部署,为实现文件系统容灾备份增加了系统的可靠性。本文对FastDFS做整体介绍,并进行系统多节点部署,在并发交易发生时,对文件上传并立即下载进行测试,实现了分布式文件系统的可靠性及可行性。 展开更多
关键词 分布式文件系统 FastDFS存储 系统架构 集群
下载PDF
分布式存储系统中文件传输优化的设计与实现 被引量:10
12
作者 金海 官象山 +1 位作者 吴松 谢超 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第1期4-6,9,共4页
针对在基于FTP的传统文件传输系统中 ,批量小文件和大文件的传输效率很低的问题 ,研究了不同类型文件传输任务的优化方法 ,提出了文件的自适应传输策略 :对小文件的传输采用通道复用技术 ,对大文件的传输则采用并行传输 .以此为基础设... 针对在基于FTP的传统文件传输系统中 ,批量小文件和大文件的传输效率很低的问题 ,研究了不同类型文件传输任务的优化方法 ,提出了文件的自适应传输策略 :对小文件的传输采用通道复用技术 ,对大文件的传输则采用并行传输 .以此为基础设计和实现了GDSS(广域网分布式存储系统 )的文件传输系统 .研究结果表明 ,广域网分布式存储系统中 ,批量小文件传输性能明显优于传统FTP ,而对于大文件的传输 ,由于采用分片并行的传输方式 ,其性能也比标准FTP的要好 . 展开更多
关键词 分布式存储系统 自适应传输 通道复用 并行文件传输
下载PDF
分布式文件系统存储介质评测与分析 被引量:9
13
作者 许春聪 黄小猛 +2 位作者 吴诺 孙宁伟 杨广文 《计算机学报》 EI CSCD 北大核心 2010年第10期1873-1880,共8页
文中分析了磁盘、SSD和DRAM的价格和能耗,测试了分布式文件系统HDFS、MooseFS和CarrierFS部署在不同存储介质上的数据吞吐率,接着提出了一种存储介质的性价比理论模型,并分析了当前、2015年和2020年不同存储介质的性价比和变化趋势.通... 文中分析了磁盘、SSD和DRAM的价格和能耗,测试了分布式文件系统HDFS、MooseFS和CarrierFS部署在不同存储介质上的数据吞吐率,接着提出了一种存储介质的性价比理论模型,并分析了当前、2015年和2020年不同存储介质的性价比和变化趋势.通过性价比分析可得,DRAM具有较大的性价比优势,适合于高并发随机访问应用.随着DRAM容量的快速提升,未来DRAM有可能成为可选的数据存储介质.当前,SSD虽然具有较好的访问性能,但其价格高、容量小、性价比低于磁盘.2015年SSD的性价比将超过磁盘,有可能替代磁盘成为大规模存储系统的基本存储设备. 展开更多
关键词 分布式文件系统 吞吐率 存储介质
下载PDF
曙光星云分布式文件系统:海量小文件存取 被引量:9
14
作者 马灿 孟丹 熊劲 《小型微型计算机系统》 CSCD 北大核心 2012年第7期1481-1488,共8页
随着互联网应用的发展和云计算的兴起,在线图片、音频、视频以及微博等服务逐渐广泛发展,这些应用展示了与传统应用截然不同的数据访问和存储模式.数据中心内每秒钟都有大量较小文件的生成、分析和返回,这些应用对高并发海量文件的高吞... 随着互联网应用的发展和云计算的兴起,在线图片、音频、视频以及微博等服务逐渐广泛发展,这些应用展示了与传统应用截然不同的数据访问和存储模式.数据中心内每秒钟都有大量较小文件的生成、分析和返回,这些应用对高并发海量文件的高吞吐、低延迟读写提出了新的挑战.提出基于分布式表存储的全新的分布式文件系统HVFS来管理数以十亿计的文件,并同时支持高吞吐和低延迟的文件访问.HVFS通过改进分布式可扩展哈希来管理元数据、日志结构的格式和列存储来利用时空局部性.本文描述了HVFS的设计和实现并进行了中等规模的实验.实验显示HVFS的表存储结构能够线性的扩展,并在82个结点上提供超过240,000次/秒、100,000次/秒的数据(<1KB)写和读;基于FUSE的实现在32个节点上提供超过180,000个/秒的文件创建速度. 展开更多
关键词 分布式文件系统 全局名字空间 海量文件 文件访问 存储
下载PDF
面向云计算的键值型分布式存储系统研究 被引量:7
15
作者 孙勇 林菲 王宝军 《电子学报》 EI CAS CSCD 北大核心 2013年第7期1406-1411,共6页
对于数据密集型的云计算应用,基于磁盘的存储系统很难同时满足它们对性能与可用性的需求.本文提出了一种以内存为主设备、以磁盘为辅助设备的键值型分布式存储系统M-Cloud,能提供大数据读写、备份及恢复等存储服务功能.M-Cloud通过将数... 对于数据密集型的云计算应用,基于磁盘的存储系统很难同时满足它们对性能与可用性的需求.本文提出了一种以内存为主设备、以磁盘为辅助设备的键值型分布式存储系统M-Cloud,能提供大数据读写、备份及恢复等存储服务功能.M-Cloud通过将数据全部装入服务器集群内存中的方式提高系统整体性能,并设计了分区线性哈希算法以实现负载均衡和高扩展性,设计了相应的数据备份与故障快速恢复策略以保证系统可靠性.仿真实验结果表明,M-Cloud具有较高的性能与可用性,对系统进一步改进和优化后具有应用于实际生产环境中的潜力,可为用户提供高质量的存储服务. 展开更多
关键词 计算 键值 分布式存储系统 线性哈希 故障恢复
下载PDF
云计算环境下分布式文件系统的负载平衡研究 被引量:10
16
作者 尹向东 杨杰 屈长青 《计算机科学》 CSCD 北大核心 2014年第3期141-144,共4页
在云计算环境下,文件以块的形式分布在文件系统中。然而系统状态的更新,如节点加入和离开,会导致文件块在系统中的分布不均衡,从而对系统执行的任务产生性能上的影响。针对该分布式文件系统的文件分布不均衡问题,提出了一种完全分布式... 在云计算环境下,文件以块的形式分布在文件系统中。然而系统状态的更新,如节点加入和离开,会导致文件块在系统中的分布不均衡,从而对系统执行的任务产生性能上的影响。针对该分布式文件系统的文件分布不均衡问题,提出了一种完全分布式的负载平衡算法,并采用了仿真实验对所提出的算法与集中式和分布式的负载均衡算法进行了对比。结果表明,该算法在解决了集中式算法的单点瓶颈的基础上只增加了少量的额外开销,其性能明显优于分布式的负载均衡算法。 展开更多
关键词 负载均衡 分布式文件系统 计算 算法
下载PDF
基于分布式共享存储系统的并行文件子系统DPFS 被引量:4
17
作者 章隆兵 陈意云 +1 位作者 章锋 陈国良 《计算机研究与发展》 EI CSCD 北大核心 2002年第3期360-366,共7页
为了改进软件 DSM系统中对文件的存取性能以获得更好的应用程序性能 ,基于软件 DSM系统 JIAJIA的并行文件子系统 DPFS被开发出来 .DPFS系统采用文件映射接口作为应用编程接口 ,使得文件存取界面简单 ,并且能充分利用软件 DSM系统的大量... 为了改进软件 DSM系统中对文件的存取性能以获得更好的应用程序性能 ,基于软件 DSM系统 JIAJIA的并行文件子系统 DPFS被开发出来 .DPFS系统采用文件映射接口作为应用编程接口 ,使得文件存取界面简单 ,并且能充分利用软件 DSM系统的大量特性 ,系统设计相对简单 .在曙光 2 0 0 0并行机上进行的应用测试表明 ,采用DPFS文件子系统后 。 展开更多
关键词 分布式共享存储系统 文件映射接口 DPFS 并行文件系统 工作站网络
下载PDF
基于新型存储器件的分布式文件系统性能优化 被引量:6
18
作者 董聪 张晓 +1 位作者 程文迪 石佳 《计算机应用》 CSCD 北大核心 2020年第12期3594-3603,共10页
新型存储器件的I/O性能通常比传统固态驱动器(SSD)高一个数量级,然而使用新型存储器件的分布式文件系统相对于使用SSD的分布式文件系统性能并没有显著的提高,这说明目前的分布式文件系统并不能充分发挥新型存储器件的性能。针对这个问题... 新型存储器件的I/O性能通常比传统固态驱动器(SSD)高一个数量级,然而使用新型存储器件的分布式文件系统相对于使用SSD的分布式文件系统性能并没有显著的提高,这说明目前的分布式文件系统并不能充分发挥新型存储器件的性能。针对这个问题,对Hadoop分布式文件系统(HDFS)的数据写入流程及传输过程进行了量化分析。通过量化分析HDFS数据写入过程各阶段的时间开销,发现在写入数据的各个阶段中,节点间数据传输的时间占比较大。因此提出了对应的优化方案,通过异步写入的方式并行化数据传输与处理过程,使得不同数据包的处理阶段叠加起来,减少了数据包整体的处理时间,从而提升了HDFS的写入性能。实验结果表明,所提方案将HDFS的写入吞吐量提升了15%~24%,总体的写入执行时间降低了28%~36%。 展开更多
关键词 分布式文件系统 HADOOP分布式文件系统 非易失性存储 性能优化 异步写入
下载PDF
一种P2P环境下分布式文件存储系统的缓存策略 被引量:7
19
作者 高伟 韩华 代亚非 《计算机工程与应用》 CSCD 北大核心 2004年第30期45-48,84,共5页
在分布式文件存储系统中,缓存技术被广泛用于提高系统性能。论文针对P2P环境下分布式文件存储系统的特点,提出了一种兼顾用户访问效率和复本一致性的灵活的缓存策略,不同于目前已经存在的P2P存储系统,论文使用“阀值”来将文件区分为热... 在分布式文件存储系统中,缓存技术被广泛用于提高系统性能。论文针对P2P环境下分布式文件存储系统的特点,提出了一种兼顾用户访问效率和复本一致性的灵活的缓存策略,不同于目前已经存在的P2P存储系统,论文使用“阀值”来将文件区分为热点文件和非热点文件,并且只针对热点文件来做缓存,根据缓存空间的使用效率和不同的文件类型来设置不同的阀值使得缓存策略灵活而有效,论文对该策略进行了理论上的分析,然后通过Trace-Driven模拟的方法验证了该策略的可行性。 展开更多
关键词 缓存 P2P 分布式文件存储系统 阀值 日志记录驱动模拟
下载PDF
基于分布式文件系统电力大数据存储策略探讨 被引量:5
20
作者 刘铭 陈艳 +2 位作者 吴佳 张春平 张琦 《自动化技术与应用》 2016年第10期70-75,共6页
随着科技的进步和时代的发展,电力行业得到长足的进步。伴随而来的是电网各个环节产生的数据量呈指数级增长,数据类型也从相对简单的结构化数据向非结构化数据转变。同时为响应国家去IOE政策和国网公司提出的集约型倡议,本文从数据的不... 随着科技的进步和时代的发展,电力行业得到长足的进步。伴随而来的是电网各个环节产生的数据量呈指数级增长,数据类型也从相对简单的结构化数据向非结构化数据转变。同时为响应国家去IOE政策和国网公司提出的集约型倡议,本文从数据的不同类型,不同的应用场景出发,对数据存储模式进行了详细的分析研究,推出了一套完整的数据存储和迁移方法 ,为国网大数据存储提供新的思路和模式。 展开更多
关键词 电网大数据 非结构化数据 分布式文件系统 高端存储
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部