期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大规模RDF图数据上高效率分布式查询处理
被引量:
9
1
作者
王鑫
徐强
+2 位作者
柴乐乐
杨雅君
柴云鹏
《软件学报》
EI
CSCD
北大核心
2019年第3期498-514,共17页
知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resourcedescriptionframework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方...
知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resourcedescriptionframework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模RDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致Map Reduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮Map Reduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQLBGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量级,且优化算法的查询时间与基本算法相比缩短了49.63%~78.71%.
展开更多
关键词
星形分解
分布式
基本图模式匹配
大规模rdf
图
MAPREDUCE
下载PDF
职称材料
Goldfish:基于矩阵分解的大规模RDF数据存储与查询系统
被引量:
11
2
作者
顾荣
仇红剑
+3 位作者
杨文家
胡伟
袁春风
黄宜华
《计算机学报》
EI
CSCD
北大核心
2017年第10期2212-2230,共19页
随着互联网应用的迅猛发展和语义网技术研究的深入,语义数据呈现出爆炸性增长趋势.一方面,对于语义数据实现高效存储和查询是语义网应用的重要基础,越来越多的语义应用可以依赖于此以提供更好的服务;另一方面,语义数据的爆炸性增长,对...
随着互联网应用的迅猛发展和语义网技术研究的深入,语义数据呈现出爆炸性增长趋势.一方面,对于语义数据实现高效存储和查询是语义网应用的重要基础,越来越多的语义应用可以依赖于此以提供更好的服务;另一方面,语义数据的爆炸性增长,对大数据环境下的语义数据的存储与查询技术提出了新的挑战.传统的基于关系型数据库的语义数据与查询系统已难以满足大规模语义数据的存储与查询需求.该文针对大规模RDF数据的存储与查询问题,以OpenRDF Sesame框架为基础,采用分布式分层式存储架构,提出并实现了属性表存储结构来进行语义数据的存储.在此基础上,针对布尔矩阵分解算法在对大规模语义数据构造属性表较慢的问题,基于Spark分布式计算框架提出并实现了并行化频繁项集挖掘算法求解大规模矩阵分解,以加速属性表的构造过程.并且,在查询层增加了基于哈希转换等查询优化.最后,基于该文所提出的索引结构和优化方法设计实现了原型系统Goldfish,并在大规模合成和真实数据集上进行了实验对比.结果表明,Goldfish原型系统比Rainbow系统查询性能平均提升约6倍,比Jena-HBase查询性能平均提升约500倍,比基于MapReduce的RDF查询系统SHARD性能平均提升约1200倍.
展开更多
关键词
大规模rdf
存储
矩阵分解
分层式存储
大数据
语义网
SPARK
下载PDF
职称材料
基于图聚类算法的大规模RDF数据查询方法研究
被引量:
6
3
作者
崔义童
冯志勇
+1 位作者
王鑫
饶国政
《小型微型计算机系统》
CSCD
北大核心
2015年第12期2625-2628,共4页
提出一种针对大规模RDF(Resource Description Framework)数据的高效而又准确的查询方法,此方法基于图聚类算法.首先利用已被证明在处理大规模图数据时效果最好的图聚类算法对大规模RDF数据进行划分,得到一个划分结果.这个划分结果满足...
提出一种针对大规模RDF(Resource Description Framework)数据的高效而又准确的查询方法,此方法基于图聚类算法.首先利用已被证明在处理大规模图数据时效果最好的图聚类算法对大规模RDF数据进行划分,得到一个划分结果.这个划分结果满足,划分子集内部连接非常紧密而划分子集之间连接非常稀疏.然后根据RDF查询请求对划分结果进行特定的筛选,在筛选所得的RDF数据子集上执行查询操作,从而节省大量查询响应时间,提高查询效率.我们实现了这一查询方法,并选取几个具有代表性的大规模RDF数据集进行了性能实验.实验证明,相比单纯运用目前效率最高的RDF-3X查询引擎进行查询的方法,本文提出的方法在保证较高查全率和查准率的前提下,能够大大提高查询效率.
展开更多
关键词
大规模rdf
数据
图聚类算法
rdf
数据划分
rdf
查询
下载PDF
职称材料
基于Spark和Redis的大规模RDF数据查询系统
被引量:
1
4
作者
阳杰
王木涵
徐九韵
《计算机系统应用》
2017年第9期69-74,共6页
随着语义Web技术的不断发展,RDF数据量增长迅速,单机RDF查询系统已经难以满足现实需要,研究和构建分布式RDF查询系统已经成为学术界与工业界的研究热点之一.现有的RDF查询系统主要是基于Hadoop或通用分布式技术.前者磁盘I/O太高;后者则...
随着语义Web技术的不断发展,RDF数据量增长迅速,单机RDF查询系统已经难以满足现实需要,研究和构建分布式RDF查询系统已经成为学术界与工业界的研究热点之一.现有的RDF查询系统主要是基于Hadoop或通用分布式技术.前者磁盘I/O太高;后者则可扩展性较差.且两种系统在基本图模式查询时,效率都较低.针对上述问题,本文设计了基于Spark和Redis的分布式系统架构,并改进了查询计划生成算法,最后实现了原型系统RDF-SR.该系统使用Spark减少了磁盘I/O,借助Redis提高了数据映射速率,利用改进的算法减少了数据混洗次数.实验表明,相比于现有的其他系统,RDF-SR既保持了较高可扩展性,又在基本图模式查询时,具有更高的性能.
展开更多
关键词
语义WEB
大规模rdf
SPARK
REDIS
下载PDF
职称材料
题名
大规模RDF图数据上高效率分布式查询处理
被引量:
9
1
作者
王鑫
徐强
柴乐乐
杨雅君
柴云鹏
机构
天津大学智能与计算学部
天津市认知计算与应用重点实验室
数字出版技术国家重点实验室
中国人民大学信息学院
出处
《软件学报》
EI
CSCD
北大核心
2019年第3期498-514,共17页
基金
国家自然科学基金(61572353
61402323
+3 种基金
61472427)
天津市自然科学基金(17JCYBJC15400)
数字出版技术国家重点实验室开放课题
北京自然科学基金(4172031)~~
文摘
知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resourcedescriptionframework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模RDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致Map Reduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮Map Reduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQLBGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量级,且优化算法的查询时间与基本算法相比缩短了49.63%~78.71%.
关键词
星形分解
分布式
基本图模式匹配
大规模rdf
图
MAPREDUCE
Keywords
star decomposition
distributed
basic graph pattern matching
large scale
rdf
graphs
MapReduce
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Goldfish:基于矩阵分解的大规模RDF数据存储与查询系统
被引量:
11
2
作者
顾荣
仇红剑
杨文家
胡伟
袁春风
黄宜华
机构
南京大学计算机软件新技术国家重点实验室
江苏省软件新技术与产业化协同创新中心
出处
《计算机学报》
EI
CSCD
北大核心
2017年第10期2212-2230,共19页
基金
国家自然科学基金专项基金(61223003)
国家自然科学基金(61370019)
江苏省科技支撑计划项目(BE2014131)资助~~
文摘
随着互联网应用的迅猛发展和语义网技术研究的深入,语义数据呈现出爆炸性增长趋势.一方面,对于语义数据实现高效存储和查询是语义网应用的重要基础,越来越多的语义应用可以依赖于此以提供更好的服务;另一方面,语义数据的爆炸性增长,对大数据环境下的语义数据的存储与查询技术提出了新的挑战.传统的基于关系型数据库的语义数据与查询系统已难以满足大规模语义数据的存储与查询需求.该文针对大规模RDF数据的存储与查询问题,以OpenRDF Sesame框架为基础,采用分布式分层式存储架构,提出并实现了属性表存储结构来进行语义数据的存储.在此基础上,针对布尔矩阵分解算法在对大规模语义数据构造属性表较慢的问题,基于Spark分布式计算框架提出并实现了并行化频繁项集挖掘算法求解大规模矩阵分解,以加速属性表的构造过程.并且,在查询层增加了基于哈希转换等查询优化.最后,基于该文所提出的索引结构和优化方法设计实现了原型系统Goldfish,并在大规模合成和真实数据集上进行了实验对比.结果表明,Goldfish原型系统比Rainbow系统查询性能平均提升约6倍,比Jena-HBase查询性能平均提升约500倍,比基于MapReduce的RDF查询系统SHARD性能平均提升约1200倍.
关键词
大规模rdf
存储
矩阵分解
分层式存储
大数据
语义网
SPARK
Keywords
large scale
rdf
store
matrix factorization
hierarchical storage
big data
semantic web
Spark
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于图聚类算法的大规模RDF数据查询方法研究
被引量:
6
3
作者
崔义童
冯志勇
王鑫
饶国政
机构
天津大学计算机科学与技术学院
天津市认知计算与应用重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2015年第12期2625-2628,共4页
基金
国家"八六三"高技术研究发展计划项目(2013AA013204)资助
国家自然科学基金项目(61100049)资助
文摘
提出一种针对大规模RDF(Resource Description Framework)数据的高效而又准确的查询方法,此方法基于图聚类算法.首先利用已被证明在处理大规模图数据时效果最好的图聚类算法对大规模RDF数据进行划分,得到一个划分结果.这个划分结果满足,划分子集内部连接非常紧密而划分子集之间连接非常稀疏.然后根据RDF查询请求对划分结果进行特定的筛选,在筛选所得的RDF数据子集上执行查询操作,从而节省大量查询响应时间,提高查询效率.我们实现了这一查询方法,并选取几个具有代表性的大规模RDF数据集进行了性能实验.实验证明,相比单纯运用目前效率最高的RDF-3X查询引擎进行查询的方法,本文提出的方法在保证较高查全率和查准率的前提下,能够大大提高查询效率.
关键词
大规模rdf
数据
图聚类算法
rdf
数据划分
rdf
查询
Keywords
large-scale
rdf
data
graph clustering
rdf
data partition
rdf
query
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Spark和Redis的大规模RDF数据查询系统
被引量:
1
4
作者
阳杰
王木涵
徐九韵
机构
中国石油大学(华东)计算机与通信工程学院
出处
《计算机系统应用》
2017年第9期69-74,共6页
文摘
随着语义Web技术的不断发展,RDF数据量增长迅速,单机RDF查询系统已经难以满足现实需要,研究和构建分布式RDF查询系统已经成为学术界与工业界的研究热点之一.现有的RDF查询系统主要是基于Hadoop或通用分布式技术.前者磁盘I/O太高;后者则可扩展性较差.且两种系统在基本图模式查询时,效率都较低.针对上述问题,本文设计了基于Spark和Redis的分布式系统架构,并改进了查询计划生成算法,最后实现了原型系统RDF-SR.该系统使用Spark减少了磁盘I/O,借助Redis提高了数据映射速率,利用改进的算法减少了数据混洗次数.实验表明,相比于现有的其他系统,RDF-SR既保持了较高可扩展性,又在基本图模式查询时,具有更高的性能.
关键词
语义WEB
大规模rdf
SPARK
REDIS
Keywords
semantic Web
big
rdf
graph
Spark
Redis
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
大规模RDF图数据上高效率分布式查询处理
王鑫
徐强
柴乐乐
杨雅君
柴云鹏
《软件学报》
EI
CSCD
北大核心
2019
9
下载PDF
职称材料
2
Goldfish:基于矩阵分解的大规模RDF数据存储与查询系统
顾荣
仇红剑
杨文家
胡伟
袁春风
黄宜华
《计算机学报》
EI
CSCD
北大核心
2017
11
下载PDF
职称材料
3
基于图聚类算法的大规模RDF数据查询方法研究
崔义童
冯志勇
王鑫
饶国政
《小型微型计算机系统》
CSCD
北大核心
2015
6
下载PDF
职称材料
4
基于Spark和Redis的大规模RDF数据查询系统
阳杰
王木涵
徐九韵
《计算机系统应用》
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部