期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
一种大规模RDF语义数据的分布式存储方案 被引量:6
1
作者 姜龙翔 王鑫 +1 位作者 李旭 冯志勇 《计算机应用与软件》 CSCD 2011年第11期30-32,59,共4页
随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以... 随着语义Web的发展,越来越多的RDF数据发布到Web上,需要一个可以提供存储和查询功能的数据管理系统来对海量的RDF数据进行管理。针对上述问题,设计并实现了一种大规模RDF语义数据的分布式存储方案。该方案通过RDF数据装载和预处理,可以有效地管理海量的RDF数据,并通过构建索引可以有效地对大规模RDF数据进行查询。工作包括底层的RDF存储方案的设计与实现,数据的预处理与装载。同时,设计了一系列实验来评估和对比不同节点数目的Cassandra集群之间的性能,数据采用的是从DBpedia获得的13 million行RDF的数据集。实验结果显示,方案对大规模RDF语义数据的存储和查询具有性能优势。 展开更多
关键词 rdf语义数据 分布式存储 三元组索引 Cassandra集群
下载PDF
基于索引的分布式RDF查询优化算法 被引量:1
2
作者 汪璟玢 方知立 《计算机科学》 CSCD 北大核心 2014年第11期233-238,共6页
在Hadoop平台中采用索引文件来辅助查询是解决海量RDF(Resource Description Framework)查询的一种新思路。目前在Hadoop平台中实现的RDF查询都较少利用索引文件,且主要针对RDF的静态数据,对数据动态更新操作的兼容性都比较差。为了克... 在Hadoop平台中采用索引文件来辅助查询是解决海量RDF(Resource Description Framework)查询的一种新思路。目前在Hadoop平台中实现的RDF查询都较少利用索引文件,且主要针对RDF的静态数据,对数据动态更新操作的兼容性都比较差。为了克服这两个缺点,提出IMSQ(using Index in MapReduce to Segment and Query)算法来对RDF文件进行分布式查询。该算法主要分为分割和查询两部分:首先为RDF进行一次星形分割,得到若干个分割,文件并建立索引文件;其次在查询时,按照分层生成连接计划,采用过滤选择策略,先找索引文件,缩小文件集,再对相应的分割文件进行查询;最后进行一次结果合并和输出。在LUBM数据集上进行的测试实验表明,在数据量大的情况下IMSQ方法的查询效率具有明显的优势。 展开更多
关键词 HADOOP rdf 索引 MAPREDUCE
下载PDF
双索引机制的RDF数据图查询方法研究 被引量:1
3
作者 郑志蕴 丁阳 +1 位作者 李伦 李钝 《小型微型计算机系统》 CSCD 北大核心 2018年第2期324-328,共5页
基于RDF图结构的关键词查询是目前的一个研究热点.针对关键词查询中存在的高存储空间和低查找效率,提出了一种双索引机制的RDF数据图查询方法.该方法首先将RDF数据转化为RDF图且为了提高关键词的查找效率利用入度为0的顶点对图进行分割... 基于RDF图结构的关键词查询是目前的一个研究热点.针对关键词查询中存在的高存储空间和低查找效率,提出了一种双索引机制的RDF数据图查询方法.该方法首先将RDF数据转化为RDF图且为了提高关键词的查找效率利用入度为0的顶点对图进行分割;其次为了实现顶点和边的查询为每一个子图构建一个顶点索引和边索引;最后利用双索引的关系以及相关性评测函数实现关键词top-k查询.实验表明,该方法与经典方法相比在索引的存储空间和查询的响应时间方面均有一定的改进. 展开更多
关键词 rdf数据图 图分割 关键词查询 索引 TOP-K
下载PDF
RDF图模型支持下的知识图谱数据索引与压缩存储算法
4
作者 鲁富宇 冷泳林 《渤海大学学报(自然科学版)》 CAS 2021年第3期277-282,共6页
知识图谱在人工智能的语义搜索、智能问答、数据分析等方面展现出巨大的价值.RDF(Resource description framework)是语义Web提供的一种存储和管理知识图谱的通用框架.随各领域知识的不断完善和扩大,知识图谱的高效检索愈加重要,研究者... 知识图谱在人工智能的语义搜索、智能问答、数据分析等方面展现出巨大的价值.RDF(Resource description framework)是语义Web提供的一种存储和管理知识图谱的通用框架.随各领域知识的不断完善和扩大,知识图谱的高效检索愈加重要,研究者提出了很多建立在RDF数据模型基础上的索引及存储方案.针对目前知识图谱数据检索时产生的大量的自连接和高数据冗余等问题,提出了一种基于路径的索引树(P-tree)及建立在该索引结构上的三元组压缩和检索算法(CRK2-triples),来实现对知识图谱数据的快速检索.实验选择包含标准SPARQL查询的数据集,并将实验结果同三种有代表性的RDF数据存储索引方案进行比较.结果表明P-tree索引及CRK2-triples压缩检索算法在处理复杂查询和大规模数据集上有较大的优势. 展开更多
关键词 知识图谱 rdf 索引 压缩存储
下载PDF
Jingwei:一种分布式大规模RDF数据服务器 被引量:4
5
作者 王鑫 冯志勇 +5 位作者 杜朴风 饶国政 姜洋 李旭 生兆花 姜龙翔 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期451-455,共5页
随着链接数据运动的开展,Web上发布的RDF数据量不断增长.开发了一种分布式大规模RDF数据服务器———Jingwei,用于高效管理大规模RDF数据集.Jingwei采用Cassandra分布式键值存储库集群作为RDF底层存储系统,具备高度的水平可伸缩性;专门... 随着链接数据运动的开展,Web上发布的RDF数据量不断增长.开发了一种分布式大规模RDF数据服务器———Jingwei,用于高效管理大规模RDF数据集.Jingwei采用Cassandra分布式键值存储库集群作为RDF底层存储系统,具备高度的水平可伸缩性;专门针对RDF数据模型特点设计了存储和索引方案,有效支持三元组模式查询的快速执行;其数据服务引擎对外提供RESTAPI服务;其Web用户界面实现了三元组模式查询和链接数据导航式浏览界面.展示了Jingwei系统的查询和导航功能.Jingwei系统为下一步数据Web搜索引擎的研制奠定了基础. 展开更多
关键词 rdf 大规模 分布式键值存储库 存储和索引方案 三元组模式查询
下载PDF
基于SPARQL查询小枝关联的RDF数据索引方案 被引量:2
6
作者 王琰 田翠华 朱顺痣 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第3期322-329,共8页
RDF(resource description framework)数据模型得到越为广泛的认可,然而RDF数据的无模式特征使得其难以使用关系数据库管理系统的优化策略.为此,基于SPARQL查询小枝的属性关联,设计一个索引RDF数据的方法.它能够支持根据动态发现的新查... RDF(resource description framework)数据模型得到越为广泛的认可,然而RDF数据的无模式特征使得其难以使用关系数据库管理系统的优化策略.为此,基于SPARQL查询小枝的属性关联,设计一个索引RDF数据的方法.它能够支持根据动态发现的新查询小枝调整索引结构,通过引入的基于格的查询小枝合并算法,减少索引的数量.并且,为获得较优的索引设计方案,设计了一个演化控制策略以达到相对优化的索引设计效果.最后,将该方案应用到开源数据库PostgreSQL上,并在相似度算法、合并算法和演化控制策略等方面进行了详细的实验,证明了本方案的有效性. 展开更多
关键词 SPARQL 查询小枝 属性关联 rdf索引
下载PDF
基于Prüfer序列的RDF数据索引与查询 被引量:4
7
作者 刘翔宇 吴刚 《计算机学报》 EI CSCD 北大核心 2011年第10期1997-2008,共12页
语义Web作为数据之网不断汇集并组织Web信息,相关应用因此面临着对语义Web所含大规模RDF数据高效访问的挑战.建立有效的索引机制是提升RDF数据管理和查询性能的一种解决之道.序列式索引既能够支持存储空间压缩又便于采用成熟的序列匹配... 语义Web作为数据之网不断汇集并组织Web信息,相关应用因此面临着对语义Web所含大规模RDF数据高效访问的挑战.建立有效的索引机制是提升RDF数据管理和查询性能的一种解决之道.序列式索引既能够支持存储空间压缩又便于采用成熟的序列匹配技术进行数据处理,具有较好的查询处理性能.文中扩展Prüfer序列以支持RDF数据上的索引和查询,实现了名为Prig的原型系统.实验比较并分析了该系统与对比系统在LUBM和SP2Bench两个测试基准上的实验结果,指出扩展的Prüfer索引在大规模RDF数据上有着比对比系统更好的查询处理性能. 展开更多
关键词 rdf Prüfer序列 索引 查询
下载PDF
基于压缩实体摘要图的RDF数据关键词查询
8
作者 林晓庆 马宗民 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第1期22-26,共5页
提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实... 提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实体的前k子图,获得查询实体之间的关系,再联合最初的关键词及他们的属性,构建SPARQL查询;最后使用SPARQL搜索引擎执行查询.实验结果表明,所提方法较其他方法有更快的响应时间及更高的准确率. 展开更多
关键词 rdf SPARQL OPS索引 压缩实体摘要图 双向搜索
下载PDF
基于邻域结构的时态RDF模型及索引方法 被引量:2
9
作者 陈圆圆 严丽 +1 位作者 章哲庆 马宗民 《计算机科学》 CSCD 北大核心 2021年第10期167-176,共10页
资源描述框架(Resource Description Framework,RDF)是W3C推荐的一种元数据模型和信息描述规范,已被广泛地应用于各个领域。为了跟踪RDF数据随时间的变化,将时态信息引入RDF的框架中,随着时态RDF数据的快速增长,对时态RDF数据的有效管... 资源描述框架(Resource Description Framework,RDF)是W3C推荐的一种元数据模型和信息描述规范,已被广泛地应用于各个领域。为了跟踪RDF数据随时间的变化,将时态信息引入RDF的框架中,随着时态RDF数据的快速增长,对时态RDF数据的有效管理变得十分必要,构建合理的索引机制能够实现对数据的高效存储和查询。文中提出了一种时态RDF数据模型,给出了具体的一维编码方案,实现了简单地表示时态信息,并以较低的开销扩展现有的RDF数据模型。在此基础上,提出了基于邻域的二级索引结构。首先利用动态计数过滤器的方法索引的邻域信息,然后利用B+树索引每个结点相关的全部时态RDF数据,同时,可对大规模时态RDF数据进行更新。实验结果表明,所提方法相比对比方法在大多数情况下性能提高了35%左右,具有可扩展性和有效性。 展开更多
关键词 rdf 时态rdf 编码 索引结构 动态计数过滤器
下载PDF
基于双时态RDF模型的索引方法 被引量:1
10
作者 王引娣 章哲庆 严丽 《计算机科学》 CSCD 北大核心 2021年第4期63-69,共7页
RDF(Resource Description Framework)已被广泛用于大数据的语义表示与处理。传统的RDF只能表示静态语义,无法满足时间敏感场景下随时间动态处理语义的需求。为此,几种时态RDF模型已被提出,包括支持事务时间或有效时间的时态RDF模型,以... RDF(Resource Description Framework)已被广泛用于大数据的语义表示与处理。传统的RDF只能表示静态语义,无法满足时间敏感场景下随时间动态处理语义的需求。为此,几种时态RDF模型已被提出,包括支持事务时间或有效时间的时态RDF模型,以及同时支持事务时间和有效时间的双时态RDF模型。为有效支持大规模时态RDF的高效处理,文中提出了一种基于双时态模型的时态RDF三层索引结构。第一层根据最大更新次数将双时态RDF数据划分为不同的数据子集;第二层在每一个数据子集上分别建立一棵四叉树来索引时间信息;第三层构建了包含3种组合键的复合位图来索引RDF三元组的主体、谓词和客体信息。实验从索引构建时间、索引占用空间,以及查询所需时间3个方面对所提时态RDF索引结构进行验证,结果表明,所提索引方案能有效缩短查询时间并提高查询效率。 展开更多
关键词 rdf 时态信息 三层索引 四叉树 位图索引
下载PDF
基于查询计算的时态RDF关键词查询
11
作者 黎海霞 《湘南学院学报》 2022年第2期28-34,58,共8页
随着时态数据的大量增加,如何查询和管理时态数据成为了当前的研究热点.资源描述框架(RDF)作为语义网标准的数据和知识表示语言已经广泛用来表示各种领域的数据,如何表示和查询时态RDF就成为了新的研究焦点.目前的大多数研究都是致力于... 随着时态数据的大量增加,如何查询和管理时态数据成为了当前的研究热点.资源描述框架(RDF)作为语义网标准的数据和知识表示语言已经广泛用来表示各种领域的数据,如何表示和查询时态RDF就成为了新的研究焦点.目前的大多数研究都是致力于如何表示时态RDF以及如何能够利用标准的SPARQL引擎查询时态RDF,但是普通用户掌握不了时态RDF数据的查询语言及模式.文章提出了新的关键词查询算法:首先根据时态RDF的特点对时态RDF进行压缩形成摘要图;然后建立两个索引,一个是借助关键词与所在时态实体的索引,本索引首次将关键字中的时间与时态实体进行对应,另一个是应用向前路径搜索优先级索引更快找到top-K子图,将待查询的关键词构建成时态SPARQL查询;最后将时态SPARQL查询转换成标准SPARQL查询,并使用SPARQL搜索引擎执行查询.实验结果表明,本方法查准率优于300METIS、300BFS、1000METI、1000BFS的图查询方法. 展开更多
关键词 时态数据 rdf SPARQL 关键词查询 OPST索引
下载PDF
基于图结构特征采样数据摘要的联邦知识图谱查询 被引量:1
12
作者 高峰 李秋 顾进广 《计算机工程》 CAS CSCD 北大核心 2023年第1期73-81,共9页
联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且... 联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且在大部分环境中联邦查询无法完成对大数据集的统计工作。为在减少数据摘要索引文件生成时间和内存开销的同时捕获尽可能真实的计数信息,考虑主语和谓语的分布偏差,提出利用样图生成原始图近似数据摘要的方法。使用对RDF图出度特征加权的采样方法获取原始图的典型样图,通过改进的映射函数将样图中的信息映射到原始图上,从而生成原始图的近似数据摘要。实验结果表明,该方法相比于基线方法至少节省了70%的数据摘要索引文件生成时间,并且仅采样0.5%的原始图生成的近似数据摘要即可在查询正确率上与基线方法保持高度一致。 展开更多
关键词 数据摘要 数据源索引 rdf图采样 联邦查询 查询性能
下载PDF
语义Web数据管理研究进展 被引量:16
13
作者 杜小勇 王琰 吕彬 《软件学报》 EI CSCD 北大核心 2009年第11期2950-2964,共15页
从数据存储组织、查询优化和处理、原型系统和基准测试等方面介绍当前RDF数据管理的研究进展和比较分析,讨论存在的问题并给出未来的研究方向.
关键词 语义WEB rdf数据 数据管理 索引 存储组织 查询优化
下载PDF
S-Index:一种面向大规模RDF数据的高效率语义索引方案 被引量:2
14
作者 魏亚洲 王鑫 +1 位作者 冯志勇 饶国政 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2015年第2期131-138,共8页
大规模RDF数据的高效查询和推理是语义Web研究中关键问题.通过研究RDFS推理规则,结合ORDPATH编码机制,提出了一种新的大规模RDF数据的索引构建方案——S-Index.S-Index的一个显著特点是,通过对RDF数据的查询即可得到RDFS蕴含知识,实现... 大规模RDF数据的高效查询和推理是语义Web研究中关键问题.通过研究RDFS推理规则,结合ORDPATH编码机制,提出了一种新的大规模RDF数据的索引构建方案——S-Index.S-Index的一个显著特点是,通过对RDF数据的查询即可得到RDFS蕴含知识,实现了离线推理.对RDF数据中的ABox和TBox进行区分,通过ORDPATH编码,分别构建TBox中的Class和Property子父关系,以及domain和range关系的语义信息.将构建的语义编码信息持久化到RDF三元组索引中,使得三元组索引承载有语义信息,也即构成语义索引并最终持久化到底层数据库.设计并进行了一系列实验,对比了语义索引与一般索引在存储和查询时的性能.实验结果表明,S-Index语义索引在没有给不支持语义的传统RDF索引增加显著额外负担和开销的情况下,获得了在查询时对推理的有效支持. 展开更多
关键词 rdf(Resource DESCRIPTION Framework) 索引 推理 查询
原文传递
A P2P Platform for Collaborative Aggregated Multimedia Sharing
15
作者 Ines Fakhfakh Hongguang Zhang Marc Girod-Genet 《Communications and Network》 2013年第3期529-543,共15页
Peer-to-peer technologies have emerged as a powerful and scalable communication model for large scale content shar-ing. However, they are not yet provided with optimized heterogeneous aggregated content management fun... Peer-to-peer technologies have emerged as a powerful and scalable communication model for large scale content shar-ing. However, they are not yet provided with optimized heterogeneous aggregated content management functionality since they lack rich semantic specifications. To overcome these shortcomings, we elaborated a reference model of P2P architecture for a dynamic aggregation, sharing and retrieval of heterogeneous multimedia contents (simple or aggre-gated). This architecture was mainly developed under the CAM4Home European research project and is fully based on the CAM4Home semantic metadata model. This semantic model relies on RDF (Resource Description Framework) and is rich (but simple enough), extensible and dedicated for the description of any kind of multimedia content.In this paper, we detail and evaluate an original semantic-based community network architecture for heterogeneous multimedia con-tent sharing and retrieval. Within the presentedarchitecture, multimedia contents are managed according to their asso-ciated CAM4Home semantic metadata through a structured P2P topology. This topology relies on a semantically en-hanced DHT (Distributed Hash Table) and is also provided with an additional indexing system for offering semantic storage and search facilities and overcoming the problem of exact match keywords in DHTs. 展开更多
关键词 P2P DHT rdf Semantics METADATA Semantic indexING and Search Multimedia Content Sharing Community NETWORKING
下载PDF
System Ⅱ:A Native RDF Repository Based on the Hypergraph Representation for RDF Data Model 被引量:1
16
作者 吴刚 李涓子 +1 位作者 胡建强 王克宏 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第4期652-664,共13页
RDF is the data interchange layer for the Semantic Web. an RDF repository should provide not only the necessary scalability In order to manage the increasing amount of RDF data, and efficiency, but also sufficient inf... RDF is the data interchange layer for the Semantic Web. an RDF repository should provide not only the necessary scalability In order to manage the increasing amount of RDF data, and efficiency, but also sufficient inference capabilities. Though existing RDF repositories have made progress towards these goals, there is still ample space for improving the overall performance. In this paper, we propose a native RDF repository, System H, to pursue a better tradeoff among system scalability, query efficiency, and inference capabilities. System II takes a hypergraph representation for RDF as the data model for its persistent storage, which effectively avoids the costs of data model transformation when accessing RDF data. Based on this native storage scheme, a set of efficient semantic query processing techniques are designed. First, several indices are built to accelerate RDF data access including a value index, a labeling scheme for transitive closure computation, and three triple indices. Second, we propose a hybrid inference strategy under the pD* semantics to support inference for OWL-Lite with a relatively low computational complexity. Finally, we extend the SPARQL algebra to explicitly express inference semantics in logical query plan by defining some new algebra operators. In addition, MD5 hash value of URI and schema level cache are introduced as practical implementation techniques. The results of performance evaluation on the LUBM benchmark and a real data set show that System Ⅱ has a better combined metric value than other comparable systems. 展开更多
关键词 rdf data management query processing index
原文传递
基于语义的元数据索引查询方法
17
作者 刘美桃 《图书情报工作》 CSSCI 北大核心 2009年第6期115-117,110,共4页
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领... 针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。 展开更多
关键词 语义元数据 元数据索引 rdf 元数据查询
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部