-
题名基于关联数据的语义互操作研究
被引量:6
- 1
-
-
作者
贾君枝
李捷佳
-
机构
山西大学经济与管理学院
-
出处
《情报理论与实践》
CSSCI
北大核心
2017年第8期131-134,111,共5页
-
基金
山西省高校"131"领军人才工程项目"叙词表与其他词表的互操作标准"(项目编号:2015052002)
山西省高等学校中青年拔尖创新人才项目"中文名称规范本体的自动构建研究"(项目编号:2016052002)的成果
-
文摘
关联数据通过RDF链接实现了跨领域、跨学科数据集之间的关联,其所形成的数据网,为数据层面的语义互操作即数据的共享及重用提供了可能。文章根据RDF三元组形式,从资源对象、谓词、属性值层面分析了基于关联数据的语义互操作的类型,总结了不同资源对象之间实现互操作的表示方法,对互操作实现工具——关联框架Silk,LIMES,R2R进行了分析,旨在为构建丰富的关联数据语义链接提供参考。
-
关键词
关联数据
语义互操作
语义链接
资源描述框架
-
Keywords
linked data
semantic interoperability
semantic linking
RDF
-
分类号
G254
[文化科学—图书馆学]
-
-
题名科研机构名称归一化实现
被引量:13
- 2
-
-
作者
贾君枝
曾建勋
李捷佳
付晓梅
-
机构
山西大学经济与管理学院
中国科技信息研究所信息资源中心
-
出处
《图书情报工作》
CSSCI
北大核心
2018年第13期103-110,共8页
-
基金
国家社会科学基金项目“机构规范文档结构及构建方式研究”(项目编号:15BTQ015),国家社会科学基金重点项目“基于关联数据的中文名称规范档语义描述及数据聚合研究”(项目编号:15ATQ004)研究成果之一
-
文摘
[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。
-
关键词
科研机构名称
聚类
K-MEANS
-
Keywords
research institution name cluster K-means
-
分类号
G254
[文化科学—图书馆学]
-
-
题名基于关联数据的作者数据聚合研究
被引量:6
- 3
-
-
作者
李捷佳
贾君枝
-
机构
山西大学经济与管理学院
中国人民大学信息资源管理学院
-
出处
《情报科学》
CSSCI
北大核心
2019年第1期16-21,共6页
-
基金
国家社会科学基金重点项目“基于关联数据的中文名称规范档语义描述及数据聚合研究”(15ATQ004)
-
文摘
【目的/意义】针对豆瓣读书书目信息中作者名称信息较少和不规范的现象,将其与中文名称规范联合数据库中个人名称数据进行聚合,丰富名称变异形式,实现异构、异地数据的相互关联。【方法/过程】首先介绍了受控词表与分众分类词表,分析了二者结合的必要性;然后构建数据集,并且基于LCS、Jaro-Winkler Diatance及编辑距离算法进行实验,确认豆瓣读书数据和中文名称规范联合数据库数据异构对齐的可行性;最后通过构造资源描述框架模式(RDFS)词表,对各实体属性进行规范化,将其发布为关联数据,实现本地站点的数据关联化。【结果/结论】基于关联数据实现了豆瓣读书作者名称数据与其对应的作品数据,以及中文名称规范库个人名称数据的聚合。
-
关键词
作者数据
中文名称规范档
关联数据
聚合
-
Keywords
author data
Chinese name authority files
linked data
aggregation
-
分类号
G250.2
[文化科学—图书馆学]
-