现有的分布式空间数据管理系统侧重于对离散点集、点序列等类型数据的索引与查询,对线、面类对象的支持不足。针对该问题,基于开源HBase数据库,提出了一种面向矢量数据的自适应分布式管理方案(vector-oriented adaptive management sche...现有的分布式空间数据管理系统侧重于对离散点集、点序列等类型数据的索引与查询,对线、面类对象的支持不足。针对该问题,基于开源HBase数据库,提出了一种面向矢量数据的自适应分布式管理方案(vector-oriented adaptive management scheme based on HBase,VA-HBase)。该方案先对点、线、面等矢量对象采用两级索引结构,主索引自适应剖分对象,寻找其合适存储层级,二级索引在全局粗粒度网格上记录覆盖对象的最小存储层级,然后设计最简字节流方法简化编码长度,优化存储空间,最后基于此设计了高效的范围查询算法。实验结果表明,所提出的VA-HBase方案能有效压缩各类矢量对象的存储空间,查询时能维持稳定的过滤性能,查询效率高于GeoMesa等对比方案约2~10倍,当数据集增大时,VA-HBase显示出良好的扩展性。展开更多
文摘现有的分布式空间数据管理系统侧重于对离散点集、点序列等类型数据的索引与查询,对线、面类对象的支持不足。针对该问题,基于开源HBase数据库,提出了一种面向矢量数据的自适应分布式管理方案(vector-oriented adaptive management scheme based on HBase,VA-HBase)。该方案先对点、线、面等矢量对象采用两级索引结构,主索引自适应剖分对象,寻找其合适存储层级,二级索引在全局粗粒度网格上记录覆盖对象的最小存储层级,然后设计最简字节流方法简化编码长度,优化存储空间,最后基于此设计了高效的范围查询算法。实验结果表明,所提出的VA-HBase方案能有效压缩各类矢量对象的存储空间,查询时能维持稳定的过滤性能,查询效率高于GeoMesa等对比方案约2~10倍,当数据集增大时,VA-HBase显示出良好的扩展性。