摘要
基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据获取;采用基于属性和基于模式的自动关联算法,与众多数据集之间实现关联。
Based on the principles and publishing method of linked data, this article introduces and analyses some technique issues of DBpedia. It extracts structured data from Wiki' s free text articles and expresses data in RDF by syntax parsing of WikiText and controlling of workflow. It also provides Web data in many ways such as URI dereference, search- ing based on SPARQL and RDF dumps. Finally, the paper uses automatic interlinking methods based on schema or properties algorithm to make linkages with a large amount of datasets.
出处
《现代图书情报技术》
CSSCI
北大核心
2010年第3期33-39,共7页
New Technology of Library and Information Service
基金
中央级公益科研院所基本科研业务费专项资金中国科学技术信息研究所预研基金项目"基于关联数据技术的信息组织深度序化研究"(项目编号:YY-200905)的研究成果之一