基于差分编码的RDF分组压缩被引量：1

RDF Grouping Compression Based on Delta Encoding

下载PDF

导出

摘要语义网技术的发展使资源描述框架(RDF)的数据量迅速增长,导致其对存储空间与传输带宽的要求不断提高。现有的通用压缩方法和RDF专用压缩方法可以解决该问题,但仍存在数据冗余。为此,提出一种基于差分编码的RDF分组压缩算法。将RDF数据根据连接宾语的谓语组合进行分组,在消除宾语冗余的同时进一步减少谓语冗余。在此基础上,针对分组后得到的主语序列,通过引入差分编码技术进一步优化其存储空间。实验结果显示,与Plain、HDT和HDT++算法相比,该算法在结构化程度低的Archives Hub、Linkedmdb、rdfabout和DBpedia数据集中可获得平均17%的性能提升,在结构化程度高的dbtune数据集中可获得23%的性能提升,表明其对于不同结构化程度的数据集均具有较好的RDF压缩性能。 With the development of semantic Web technology,the volume of Resource Description Framework(RDF)data is increasing rapidly along with its demand for storage space and transmission bandwidth.Existing general compression methods and RDF-specific compression methods can solve this problem,but still suffer from a lack of data redundancy.To this end,this paper proposes an RDF grouping compression algorithm based on delta encoding.The algorithm groups RDF data according to the combination of predicates connected to the object,so as to further reduce predicate redundancy while eliminating object redundancy.On this basis,it further optimizes the storage space of the grouped subject sequence data by introducing delta coding technology.Experimental results show that,compared with the Plain,HDT and HDT++algorithm,this algorithm improves the performance by 17%on average in less structured datasets including Archives Hub,Linkedmdb,rdfabout and DBpedia,meanwhile improves performance by 23%on average in highly structured dataset dbtune,which demonstrates that the proposed algorithm has better RDF compression performance in datasets with different degrees of structure.

作者伍伟鑫韩京宇朱曼 WU Weixin;HAN Jingyu;ZHU Man(School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)

机构地区南京邮电大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2020年第11期117-123,共7页 Computer Engineering

基金国家自然科学基金(61602260) 江苏省社科基金重点项目(18GLA004)。

关键词语义网资源描述框架结构化程度数据压缩差分编码 sematic Web Resource Description Framework(RDF) degree of structure data compression delta encoding

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1袁平鹏,刘谱,张文娅,吴步文.高可扩展的RDF数据存储系统[J].计算机研究与发展,2012,49(10):2131-2141. 被引量：9
2杜小勇,王琰,吕彬.语义Web数据管理研究进展[J].软件学报,2009,20(11):2950-2964. 被引量：16
3王鑫,徐强,柴乐乐,杨雅君,柴云鹏.大规模RDF图数据上高效率分布式查询处理[J].软件学报,2019,30(3):498-514. 被引量：9

二级参考文献32

1World Wide Web Consortium: RDF/XML Syntax Specification (Revised) [OL]. [2004-02-10]. http://www. w3. org/TR/2004/REC-rdf-syntax-grammar.
2W3C SWEO Community Project. Linking open data on the semantic Web [OL]. [2012-03-17]. http://www, w3. org/ wiki/SweoIG/TaskForces / Community- Projects/LinkingOpenData.
3Broekstra J, Kampman A, Harmelen F. Sesame: A generic architecture for storing and querying RDF and RDF schema [G] //LNCS 2342: Proe of the 1st Int Semantic Web Conf. Berlin: Springer, 2002:54-68.
4Weiss C, Karras P, Bernstein A. Hexastore: Sextuple indexing for semantic Web data management [C] //Proc of VLDB'2008. Trondheim, Norway: VLDB Endowment, 2008: 1008-1019.
5Neumann T, Weikum G. Scalable join processing on very large RDF graphs [C] //Proc of ACM SIGMOD 2009. New York.. ACM, 2009:627-639.
6Neumann T, Weikum G. The RDF-3X engine for scalable management of RDF data [J]. VLDB Journal, 2010, 19(1) 91-113.
7Abadi D J, Marcus A, Madden S R, et al. Scalable semantic Web data management using vertical partitioning [C] //Proc of VLDB'2007. Trondheim, Norway: VLDB Endowment, 20071 411-422.
8SWAT Projects of Lehigh University. LUBM[OL]. [2012 03-17]. http://swat, cse. lehigh, edu/projeets/lubm/.
9Guo Y, Pan Z, Heflin J. LUBM: A benchmark for OWL knowledge base systems [J]. Journal of Web Semantics, 2005, 3(2/3) :158-182.
10Wilkinson K, Sayers C, Kuno H, et al. Efficient RDF storage and retrieval in Jena2 [C] //Proc of the 1st Int Workshop on Semantic Web and Databases. 2003 :131-150.

共引文献29

1鲁富宇,冷泳林.RDF图模型支持下的知识图谱数据索引与压缩存储算法[J].渤海大学学报（自然科学版）,2021,42(3):277-282.
2朱敏,程佳,柏文阳.一种基于HBase的RDF数据存储模型[J].计算机研究与发展,2013,50(S1):23-31. 被引量：8
3李广庆,何丰.一种基于本体的农业气象系统的研究及设计[J].硅谷,2010,3(21):87-87.
4王星,宋金玉,陈爽,陈萍.基于列数据库的RDF数据管理实现[J].计算机技术与发展,2012,22(6):53-56. 被引量：3
5袁平鹏,刘谱,张文娅,吴步文.高可扩展的RDF数据存储系统[J].计算机研究与发展,2012,49(10):2131-2141. 被引量：9
6李韧,杨丹,胡海波,谢娟,吴云松,傅鹂.云计算环境下的SWRL规则分布式推理框架[J].重庆大学学报（自然科学版）,2013,36(2):56-62. 被引量：2
7任长宁,郑东霞,李绪成.基于传感器的远程设备知识获取系统的设计与实现[J].软件工程师,2013(4):30-31.
8李斌.大数据及其发展趋势研究[J].广西教育,2013(35):190-192. 被引量：10
9许德山,张运良.集成化本体管理平台的设计与实现[J].数字图书馆论坛,2013(11):15-20. 被引量：3
10郑少兰.关系数据库中本体完整性约束验证方法[J].福建电脑,2013,29(10):149-151.

同被引文献21

1郝斌,顾畹仪.光差分相移键控调制格式原理[J].现代有线传输,2005(4):70-73. 被引量：6
2宋志强,祁海峰,王晨,尚盈,王昌.窄线宽光纤激光器及其在光纤传感中的应用[J].光学学报,2015,35(A02):109-114. 被引量：5
3曹晔,赵晨,童峥嵘.可双参量同时测量的干涉型全光纤传感器[J].光子学报,2015,44(10):82-87. 被引量：12
4解锐静,李洪祚,张慧颖.基于LabVIEW的PSK调制信号的识别[J].长春理工大学学报（自然科学版）,2016,39(1):134-138. 被引量：2
5豆朋达,温宗周,马亚龙,高园平,薛冬旺,钱佳佳.分布式光纤传感器大坝安全监控系统研究[J].单片机与嵌入式系统应用,2017,17(7):47-52. 被引量：1
6宋牟平,庄守望,王轶轩.相位敏感光时域反射计的高频振动检测[J].中国激光,2020,47(5):440-444. 被引量：12
7张旭苹,丁哲文,洪瑞,陈晓红,梁蕾,张驰,王峰,邹宁睦,张益昕.相位敏感光时域反射分布式光纤传感技术[J].光学学报,2021,41(1):93-107. 被引量：62
8陈浩,徐阳,钱森,陈川,郭经红,苏磊.分布式光纤超声传感器用于检测电缆接头放电故障[J].光学学报,2021,41(3):16-24. 被引量：18
9董新桐,李月,刘飞,冯黔堃,钟铁.基于卷积神经网络的井中分布式光纤传感器地震数据随机噪声压制新技术[J].地球物理学报,2021,64(7):2554-2565. 被引量：13
10曾凌川,白燕,卢晓春,袁洪,宿晨庚,吴小婧.一种基于调制m序列的直接序列扩频信号调制方法[J].电子与信息学报,2021,43(8):2156-2164. 被引量：14

引证文献1

1齐跃峰,王玉琳,朱奕铖,杨子雄,李天,金琢然.一种新型的DPSK解调系统及性能研究[J].光学学报,2023,43(5):61-69. 被引量：2

二级引证文献2

1安宁,尹保军,陈淑涵,郭英,齐跃峰.光纤传感技术研究进展[J].燕山大学学报,2023,47(5):441-457. 被引量：2
2闫茜茜.基于Turbo编码的低信噪比下可靠通信技术研究[J].通信电源技术,2023,40(20):162-164.

1张玉峰,邓丽平.指向物理学科核心素养的试题命制策略[J].中学物理,2020,38(19):24-31. 被引量：5
2牛兴荣,耿雷,程燕声,肖萌.CNAS实验室认可能力数据分析与规范化治理研究[J].中国检验检测,2020,28(4):46-48. 被引量：6
3陈涛,刘学军,张伯君.融合知识图谱语义信息的推荐方法[J].计算机工程与设计,2020,41(11):3047-3052. 被引量：6
4解存英.小学数学增强学生知识结构化的策略探究[J].启迪,2020(10):45-47.
5赵越鹏,万旺根,王旭智.植物点云空间划分管理算法研究[J].电子测量技术,2020,43(14):34-38.
6姜龙,骆勇.基于人工智能技术的运动教学视频压缩算法[J].现代电子技术,2020,43(21):55-58.
7蔡亮.RISC-V架构的高速接口芯片设计及USB3.0应用[J].单片机与嵌入式系统应用,2020,20(11):11-14. 被引量：4
8程庆丰,李钰汀,李兴华,姜奇.面向边缘计算环境的密码技术研究综述[J].计算机科学,2020,47(11):10-18. 被引量：8
9郝现伟,邹伟,王颖,郑云龙.航天时间分区总线技术研究[J].测控技术,2020,39(10):97-102.
10张远强,史国友,李松.基于在线有向无环图的船舶轨迹压缩算法[J].交通运输工程学报,2020,20(4):227-236. 被引量：8

计算机工程

2020年第11期

浏览历史

内容加载中请稍等...

基于差分编码的RDF分组压缩被引量：1

参考文献3

二级参考文献32

共引文献29

同被引文献21

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于差分编码的RDF分组压缩 被引量：1

参考文献3

二级参考文献32

共引文献29

同被引文献21

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于差分编码的RDF分组压缩被引量：1