-
题名基于HBase的RDF数据存储方案研究与设计
被引量:5
- 1
-
-
作者
王媛媛
吕晓丹
胡琪
吴鸿川
-
机构
贵州大学计算机科学与技术学院
贵州大学大数据与信息工程学院
-
出处
《信息网络安全》
2016年第3期59-63,共5页
-
基金
黔科合JZ字[2014]2001
-
文摘
针对RDF数据的存储问题,文章提出一种利用分布式数据库HBase以及设计数据库的Rowkey进行有效存储的方案,主要利用HBase与RDF数据的特点,使用经典的BKDRHash算法对谓词进行散列计算,将散列值与谓词作为主键,实现数据的存储。有效设置HBase的Rowkey不仅避免出现节点堆积现象,BKDRHash算法的使用也保证了数据的完整性。为证明该存储模式的有效性,文章实验选择利用Map Reduce将数据生成HBase内部存储格式HFile文件进行并行加载。实验证明,针对这样的存储模式,当数据量很大时数据加载性能较好。使用LUBM测试集进行仿真实验,证明该方案是有效的。
-
关键词
语义网
RDF数据
HBASE
MAPREDUCE
hfile文件
-
Keywords
semantic Web
RDF data
HBase
MapReduce
hfile file
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-