摘要
针对现有的基于关系数据库和图数据库存储RDF数据集的几种模型中查询性能的不足,将列数据库和图缓存相结合,提出一种新的管理海量RDF数据的方案.该方案在底层磁盘采用基于列的关系存储,同时在内存中构建RDF图模式的存储,并设计实现了一套新的SPARQL查询引擎.通过相关分析和各种存储模式的实验结果对比分析,验证了该方案的可行性,表明了该方案具有更高的查询效率.
Aiming at the poor query performance of several models based on relational databases and graph database for RDF dataset storage,a new method is given to store and manage the massive data efficiently by combining the column-oriented model and graph model. RDF data is stored in disk based on column-oriented relational model. Part of RDF data are loaded in memory as graph schema. Besides,a SPARQL query engine is designed and implemented. According to results of the comparative experiment,this method is practicable and more efficient in query performance.
出处
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2015年第2期145-150,共6页
Journal of Wuhan University:Natural Science Edition
基金
国家自然科学基金(60803160
61100133
61272110)
国家社会科学基金重大计划(11&ZD189)
湖北省自然科学基金计划(2013CFB334)
湖北省教育厅科研项目(Q20101110
D2009110)
湖北省高等学校优秀中青年科技创新团队计划(T201202)
湖北省教育厅教研项目(2011s005)
武汉市科技攻关计划(201110821225)
软件工程国家重点实验室(武汉大学)开放基金(SKLSE2012-09-07)
关键词
海量RDF
列式数据库
内存图模型
缓存查找
massive RDF column-oriented database memory graph model cache lookup