期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
HDVM:基于关系矩阵的关联数据压缩查询模型 被引量:3
1
作者 符海东 彭燊 +1 位作者 黄莉 顾进广 《电子学报》 EI CAS CSCD 北大核心 2018年第3期721-729,共9页
随着大数据时代的到来,大量的RDF数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPARQL查询.本文提出了一种HDVM(Heade... 随着大数据时代的到来,大量的RDF数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPARQL查询.本文提出了一种HDVM(Header Dictionary Vector Matrix)压缩查询模型,通过在关联数据集中提取潜在的三元组关系矩阵,以主语向量、谓语向量和宾语矩阵的模型序列化存储来减少关联数据重复出现的次数,允许SPARQL查询在压缩状态下全内存执行.实验结果表明,本文提出的模型比常用的HDT(Header-Dictionary Triples)压缩方式提高了3%~20%的压缩率,同时在三元组个数达到十亿级别的数据集上平均查询时间在400ms左右. 展开更多
关键词 关系矩阵 关联数据 查询 压缩
下载PDF
知识图谱中链接数据质量评价研究综述 被引量:4
2
作者 顾进广 朱婷婷 +1 位作者 黄莉 田萍芳 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2017年第1期22-38,共17页
链接数据为知识图谱的主要表现形式,但目前链接数据的发布缺少统一标准,导致数据质量参差不齐.本文回顾了链接数据质量评价的相关研究,并根据链接数据的发展过程,将衡量数据质量的维度划分为7个类型,分别描述每个数据质量维度的特性.同... 链接数据为知识图谱的主要表现形式,但目前链接数据的发布缺少统一标准,导致数据质量参差不齐.本文回顾了链接数据质量评价的相关研究,并根据链接数据的发展过程,将衡量数据质量的维度划分为7个类型,分别描述每个数据质量维度的特性.同时,具体介绍了冗余度、可信性的量化评价方法及波动性对链接数据质量的影响. 展开更多
关键词 链接数据 质量评价 质量维度 知识图谱
原文传递
一种高密度关联数据压缩方案
3
作者 彭燊 杨璐 顾进广 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2017年第5期453-458,共6页
随着语义网技术的标准化,网络上的关联数据爆炸式增长.海量的关联数据在网络上存储和交换变得越来越困难.本文提出了一种高密度关联数据压缩方案,将关联数据的三维关系矩阵分解成3个二维稀疏矩阵,再用K2-Tree压缩二维稀疏矩阵,提高了关... 随着语义网技术的标准化,网络上的关联数据爆炸式增长.海量的关联数据在网络上存储和交换变得越来越困难.本文提出了一种高密度关联数据压缩方案,将关联数据的三维关系矩阵分解成3个二维稀疏矩阵,再用K2-Tree压缩二维稀疏矩阵,提高了关联数据的压缩率和压缩效率.实验表明,本文提出压缩方案的压缩率相较于HDT++平均有12%的提高,压缩耗时相较于HDT++也有10%左右的降低. 展开更多
关键词 关联数据 压缩 降维 K2树
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部