-
题名基于LZO的Hadoop文件归档优化方法
- 1
-
-
作者
张军
苏文浩
-
机构
东华理工大学软件学院
东华理工大学信息工程学院
-
出处
《计算机与现代化》
2023年第6期1-6,26,共7页
-
基金
国家自然科学基金资助项目(62162002,61662002,61902189)
江西省自然科学基金资助项目(20212BAB202002)
+1 种基金
江西省放射性地学大数据技术工程实验室开放基金资助项目(JELRGBDT201905)
江苏省高等学校基础科学(自然科学)研究项目(22KJA520004)。
-
文摘
Hadoop分布式框架被广泛应用于各行业大数据处理领域,但在存储大量小文件时会产生更多的元数据信息,导致名称节点的内存占用过多,影响其对外提供高性能和高并发访问的能力。对小文件进行归档存储,是有效解决该问题的常用方案。同时,考虑到数据压缩可有效减少数据存储空间大小与网络数据传输负载,本文提出一种基于实时无损压缩算法LZO的Hadoop文件归档优化方法LA(LZO-Archive)。该方法先对小文件进行归档合并,在索引文件生成阶段融合LZO压缩算法,减少索引文件的生成时间。同时,设计一种文件压缩存储算法,对数据文件和索引文件进行压缩存储,有效减少了数据所占用的数据节点磁盘空间大小和名称节点内存空间占用大小。实验结果表明,相对于原始的HDFS数据存储方法、基准的文件归档方法HAR以及对比方法LHF,本文提出的LA方法在文件归档时间、名称节点内存占用、数据节点磁盘空间占用、文件访问时间等方面表现更好。
-
关键词
HADOOP
HDFS
小文件
归档方案
LZO算法
-
Keywords
Hadoop
HDFS
small files
archiving storage
LZO algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名国家气象中心NWP新资料归档系统的技术待征
- 2
-
-
作者
王湘兰
-
机构
国家气象中心
-
出处
《应用气象学报》
CSCD
北大核心
1999年第1期124-128,共5页
-
基金
"八五"台风暴雨数值预报系统业务运作和监控方案的研究与设计课题
-
文摘
文章简要介绍了“八五”以来,国家气象中心数值预报系统新的归档方案设计特点、意义、内容,并探讨了归档软件开发中的一系列技术问题.
-
关键词
归档方案设计
软件开发
数值预报
气象观测资料
-
Keywords
Archive scheme design Software development
-
分类号
P468.0
[天文地球—大气科学及气象学]
P456.7
[天文地球—大气科学及气象学]
-
-
题名中药企业经营质量档案工作的实践与思考
- 3
-
-
作者
朱海嫔
-
机构
上海市药材有限公司
-
出处
《上海医药》
CAS
2017年第17期56-58,共3页
-
文摘
本文主要阐述了企业在质量管理过程中,档案部门主动参与企业经营质量规范管理的每个重要环节,运用档案管理,对中药企业质量档案的组成、收集、分类、整理等有针对性地制定归档方案,确保企业质量档案的可追溯性,使质量档案实现预期目标。
-
关键词
质量档案
归档范围
归档方案
-
Keywords
quality archive
archive range
archive plan
-
分类号
F273.2
[经济管理—企业管理]
F426.72
[经济管理—产业经济]
G271
[文化科学—档案学]
-