基于列数据库和图缓存的海量RDF管理被引量：2

Massive RDF Management Based on Column Oriented Database and Graph Cache

导出

摘要针对现有的基于关系数据库和图数据库存储RDF数据集的几种模型中查询性能的不足,将列数据库和图缓存相结合,提出一种新的管理海量RDF数据的方案.该方案在底层磁盘采用基于列的关系存储,同时在内存中构建RDF图模式的存储,并设计实现了一套新的SPARQL查询引擎.通过相关分析和各种存储模式的实验结果对比分析,验证了该方案的可行性,表明了该方案具有更高的查询效率. Aiming at the poor query performance of several models based on relational databases and graph database for RDF dataset storage,a new method is given to store and manage the massive data efficiently by combining the column-oriented model and graph model. RDF data is stored in disk based on column-oriented relational model. Part of RDF data are loaded in memory as graph schema. Besides,a SPARQL query engine is designed and implemented. According to results of the comparative experiment,this method is practicable and more efficient in query performance.

作者徐芳芳顾进广邓海龙田萍芳

机构地区武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2015年第2期145-150,共6页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金(60803160 61100133 61272110) 国家社会科学基金重大计划(11&ZD189) 湖北省自然科学基金计划(2013CFB334) 湖北省教育厅科研项目(Q20101110 D2009110) 湖北省高等学校优秀中青年科技创新团队计划(T201202) 湖北省教育厅教研项目(2011s005) 武汉市科技攻关计划(201110821225) 软件工程国家重点实验室(武汉大学)开放基金(SKLSE2012-09-07)

关键词海量RDF 列式数据库内存图模型缓存查找 massive RDF column-oriented database memory graph model cache lookup

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1I.iu X F, Thomsen C, Pedersen T B, et al. 3XI.: An Efficient DBMS-Based Triple-Store[DB/OL]. [2014-03-04]. http://ieee:rJlore, ieee. org/xpl/articleDe.tails, jsp? reload true arnumber--6327440.
2Atre M, Chaoji V, Zaki M J, etal. Matrix Bit load- ed: a scalable lightweight join query processor for RDF data[C]//Proceedings of the 19th International Con ference on World Wide Web, WWW '10. New York: ACM, 2010.. 41-50.
3Liarou E, Idreos S, Manegold S, et al. MonetDB/ DataCell.. Online Analytics in a Streaming Column- Store[J]. PVLDB, 2012,8:1910-1913.
4项灵辉,顾进广,吴钢.基于图数据库的RDF数据分布式存储[J].计算机应用与软件,2014,31(11):35-39. 被引量：12
5Idreos S, Groffen F, Nes N,et al. MonetDB: Two decades of research in column-oriented database archi tectures[J]. Bulletin of the IEEE Computer Society Technical Committee on Data Engineering, 2012, 35 : 40-45.
6Bizer C, Sehultz A. The Berlin SPARQI. Benchmark [J]. IntJ Semantic Web lnf Syst, 2009, 5(2): 1-24.

二级参考文献16

1Berners-Lee Tim, James Hendler, Ora Lassila. The semantic web [ J 1. Scientific American Magazine ,2001 ( 8 ).
2RDF current status [ EB/OL ]. http ://www. w3. org/standards/techs/ rdf#w3 c_all.
3Noels,Steven. NOSQL [ J ]. Informatie-Maandblad voor de Informatievoorz- iening,2011,53(7).
4RDF access to relational databases [ EB/OL]. http://www, w3. org/ 2003/01/21 - RDF - RDB - access/.
5Storing RDF in a relational database [ EB/OL]. http ://infolab. stan- ford. edu! melnik/rdf/db, html.
6Kevin Wilkinson, Craig Sayers, Harumi A Kuno, et al. Efficient RDF storage and retrieval in Jena2 [ E ]//Proceedings of SWDB,2003 : 131 - 150.
7CraiG Franke,Samuel Morin,Artem Chebotko. Distributed semantic web data management in HBase and MySQL cluster[ C]//2011 IEEE 4th In- ternational Conference on Cloud Computing,2011:105-112.
8Renzo Angles, Claudio Gutierrez. Querying RDF data from a graph da- tabase perspective [ C ]//Proceedings of ESWC,2005 : 346 - 360.
9Valerie Bonstrom, Annika Hinze, Heinz Schweppe. Storing RDF as a graph [ C ]//Proceedings of LA-WEB ,2003:27 - 36.
10Infinitegraph [ EB/OL]. http ://www. infinitegraph, corn/.

共引文献11

1冯鑫,李雪,闫月,李佳培,刘梦瑶,吴晔.基于知识实体的突发公共卫生事件数据平台构建研究[J].知识管理论坛,2020(3):175-190. 被引量：2
2王明强,张磊,崔一迪,陈欣然,李国正.利用Neo4j存储中医皮肤病“病-证-治”本体方法的研究[J].世界科学技术-中医药现代化,2020,22(8):2914-2921. 被引量：14
3王丽娟,吴刚.知识图谱数据管理系统的设计与实现[J].电子技术与软件工程,2016(24):200-202. 被引量：1
4王红,张青青,蔡伟伟,姜洋.基于Neo4j的领域本体存储方法研究[J].计算机应用研究,2017,34(8):2404-2407. 被引量：36
5王丽娟,龚渊博.知识图谱数据管理系统设计[J].电脑与信息技术,2017,25(1):63-65. 被引量：1
6王丽娟.面向匹配结果不可排序的Top-k查询算法研究与实现[J].电脑与信息技术,2017,25(5):12-15.
7潘理虎,张佳宇,张英俊,谢建林.煤矿领域知识图谱构建[J].计算机应用与软件,2019,36(8):47-54. 被引量：22
8杨政.面向关联关系的特定领域图数据库检索系统[J].电脑知识与技术,2019,15(9X):10-12. 被引量：1
9程玉娟,方俊伟,赖涵.试论图数据库本体存储方法的比较[J].科学与信息化,2020,0(1):57-57.
10吴建胜,冯锡炜,陈浩,侯伟,李品乐,赵驰,王超琦,桂亚飞.基于分布式的RDF数据分割方法研究[J].现代计算机,2023,29(20):16-21.

同被引文献12

1龚立群,高琳.RDF查询语言的比较研究[J].计算机时代,2007(3):6-8. 被引量：2
2曹妍.本体理论在城市智能交通系统语义集成中的应用研究[D].大连:大连海事大学,2010.
3王志华,赵伟.基于本体的语义网检索模型及关键技术研究[J].计算机工程与设计,2011,32(1):145-148. 被引量：16
4陈龙,万定生,顾昕辰.基于Hive的水利普查数据仓库[J].计算机与现代化,2014(5):127-130. 被引量：9
5王静蕾,赵明慧.云平台中基于HBase的RDF数据存储模型研究[J].中州大学学报,2014,31(6):116-119. 被引量：2
6张红,王晓明,曹洁,朱昶胜.基于大数据的智能交通体系架构[J].兰州理工大学学报,2015,41(2):112-115. 被引量：36
7王有为,王伟平,孟丹.基于统计方法的Hive数据仓库查询优化实现[J].计算机研究与发展,2015,52(6):1452-1462. 被引量：16
8康杰华,罗章璇.基于图形数据库Neo4j的RDF数据存储研究[J].信息技术,2015,39(6):115-117. 被引量：25
9佟强,程经纬,张富,张丽丽,马宗民.基于查询转换的RDF高效查询方法[J].吉林大学学报（工学版）,2015,45(5):1550-1558. 被引量：7
10王巍巍,王志刚,潘亮铭,刘阳,张江涛.双语影视知识图谱的构建研究[J].北京大学学报（自然科学版）,2016,52(1):25-34. 被引量：29

引证文献2

1余超,王坚,凌卫青.基于Hadoop的海量交通数据混合存储查询系统设计与实现[J].信息技术与信息化,2016(1):82-86. 被引量：2
2夏宇航,高大启,阮彤,王昊奋,殷亦超.基于知识图谱的医疗病历数据存储研究[J].计算机工程,2019,45(1):9-16. 被引量：15

二级引证文献17

1褚少鹤,周洁,王敬平.基于HBase的交通大数据存储查询平台的设计及实现[J].软件,2019,40(2):138-140.
2韩普,马健,张嘉明,刘亦卓.基于多数据源融合的医疗知识图谱框架构建研究[J].现代情报,2019,39(6):81-90. 被引量：25
3陈玉林,王武.Hbase行键优化设计与热点防治策略[J].信息与电脑,2019,0(15):145-146. 被引量：1
4张庆,孙超.基于纠删编解码算法的医疗数据存储系统容错策略优化[J].新一代信息技术,2019,2(20):47-52.
5梅莹莹.基于云计算的嵌入式网络离散数据智能选址存储方法研究[J].信息工程大学学报,2019,20(5):567-570.
6韦妹爱,余艳梅,农爱妮,黄彩艳,兰闯.基于门急诊输液过程的患者移动输液管理模型的构建和临床应用研究[J].中国现代医生,2020,58(9):189-192. 被引量：4
7王艳杰,宋磊.基于可信连接的激光网络异质信息主动融合研究[J].激光杂志,2020,41(7):153-156.
8李晓峰,焦洪双,王妍玮.基于量子计算的医疗数据敏感度度量[J].计算机技术与发展,2021,31(1):187-191. 被引量：1
9张静.基于总线架构的医疗电子病例数据库安全访问模型[J].自动化技术与应用,2021,40(2):42-47. 被引量：2
10王鑫,赵清杰,徐瑞.基于知识图谱的深空探测器任务规划建模[J].深空探测学报（中英文）,2021,8(3):315-323. 被引量：3

1卢东明.对列式数据库的一点总结和展望[J].软件和信息服务,2013(4):67-67.
2霄岳.列式数据库新标准问世[J].上海商业,2011(12):68-68.
3石菲.列式数据库持续突破[J].中国计算机用户,2009(16):60-60. 被引量：2
4Teraclata建立列式数据库新标准[J].信息与电脑,2011(11):75-75.
5孙惠生.浅谈列式数据库[J].企业技术开发,2010,29(11):43-43. 被引量：4
6熊力,顾进广,项灵辉.基于列式数据库的RDF数据分布式存储[J].数学的实践与认识,2014,44(5):148-156. 被引量：2
7Teradata建立列式数据库新标准[J].中国电子商情（通信市场）,2011(5):4-5.
8石菲.赛贝斯力推列式数据库[J].中国计算机用户,2009(2):91-91.
9袁绍军.云计算呼唤列式数据库[J].网管员世界,2011(19):18-18.
102009年度十大事件[J].软件世界,2010(1):34-38.

武汉大学学报（理学版）

2015年第2期

浏览历史

内容加载中请稍等...

基于列数据库和图缓存的海量RDF管理被引量：2

参考文献6

二级参考文献16

共引文献11

同被引文献12

引证文献2

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于列数据库和图缓存的海量RDF管理 被引量：2

参考文献6

二级参考文献16

共引文献11

同被引文献12

引证文献2

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于列数据库和图缓存的海量RDF管理被引量：2