-
题名基于Hadoop的空间科学大数据的区域检索算法
被引量:8
- 1
-
-
作者
王广钰
李英玉
-
机构
中国科学院大学
中国科学院国家空间科学中心
-
出处
《电子设计工程》
2018年第5期48-51,56,共5页
-
文摘
针对空间科学大数据的快速检索需求,提出了分布式区域检索算法。算法主要包括四维空间科学数据的索引方法和分布式四维空间科学数据的索引架构两部分。在KTS存储结构下,通过基于立方体的Block-Grid三维网格剖分方法建立两级空间索引结构,包括分布式节点间的全局索引和分布式节点内的局部索引;在分布式系统架构下,确定了索引在分布式主从节点的分布策略以及数据在分布式环境下的容错机制。基于Hadoop基础架构设计了NSSC-Hadoop系统,通过多组试验数据测试算法效率,并与直接基于Hadoop无索引遍历数据方式相比较,数据检索效率提高了将近50倍,随着数据量的增大,算法优势会更加明显。
-
关键词
空间科学大数据
分布式区域检索算法
两级索引结构
NSSC-Hadoop系统架构
-
Keywords
spatial scientific big data
distributed region search algorithm
two-level index structure
NSSC-Hadoop system architecture
-
分类号
TN99
[电子电信—信号与信息处理]
-