-
题名一种大规模RDF语义数据的分布式存储方案
被引量:6
- 1
-
-
作者
姜龙翔
王鑫
李旭
冯志勇
-
机构
天津大学软件学院
天津大学计算机科学与技术学院
-
出处
《计算机应用与软件》
CSCD
2011年第11期30-32,59,共4页
-
基金
国家自然科学基金项目(61070202)
天津大学自主创新基金(60302022)
-
文摘
随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以有效地管理海量的RDF数据,并通过构建索引可以有效地对大规模RDF数据进行查询。工作包括底层的RDF存储方案的设计与实现,数据的预处理与装载。同时,设计了一系列实验来评估和对比不同节点数目的Cassandra集群之间的性能,数据采用的是从DBpedia获得的13 million行RDF的数据集。实验结果显示,方案对大规模RDF语义数据的存储和查询具有性能优势。
-
关键词
rdf语义数据
分布式存储
三元组索引
cassandra集群
-
Keywords
rdf semantic data distributed storage triple index cassandra cluster
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-