期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于Wikidata开展身份管理的模式研究
1
作者 陈辰 钟雨轩 《国家图书馆学刊》 北大核心 2024年第2期83-95,共13页
Wikidata作为开放数据知识库和标识符链接中枢,在改善规范控制工作方面具有较大的潜力,逐渐受到图书馆及相关机构的关注。文章系统调研国内外基于Wikidata开展身份管理的研究与实践进展,在文献调研和案例分析的基础上将其模式划分为链... Wikidata作为开放数据知识库和标识符链接中枢,在改善规范控制工作方面具有较大的潜力,逐渐受到图书馆及相关机构的关注。文章系统调研国内外基于Wikidata开展身份管理的研究与实践进展,在文献调研和案例分析的基础上将其模式划分为链接模式、融合模式和集中模式三种类型,并对三种模式的含义、实践案例、应用价值及模式关系等问题进行了系统探讨。基于对Wikidata身份管理模式最新实践的认识,尝试提出对于我国名称规范控制带来的几点启示,包括在MARC记录中融入外部标识符、在发现系统中进行元数据增强、积极参与集中聚合平台建设。参考文献61。 展开更多
关键词 身份管理 规范控制 wikidata 转型模式
下载PDF
基于Wikidata的COVID-19信息组织策略研究
2
作者 杨倩 李小丽 《现代信息科技》 2023年第3期1-7,共7页
对Wikidata数据模型以及其对COVID-19信息组织等模式进行研究,以期对国内信息组织等相关领域的研究以及COVID-19数据整合的相关工作提供借鉴和参考。首先对主流的三个知识库进行对比分析,其次将Wikidata中的中国COVID-19数据与中国国家... 对Wikidata数据模型以及其对COVID-19信息组织等模式进行研究,以期对国内信息组织等相关领域的研究以及COVID-19数据整合的相关工作提供借鉴和参考。首先对主流的三个知识库进行对比分析,其次将Wikidata中的中国COVID-19数据与中国国家卫生健康委员会的疫情数据进行多个维度的比较分析,最后对Wikidata中的COVID-19数据可视化基础框架进行分析,以探索Wikidata对COVID-19信息组织策略。Wikidata具有灵活的数据模型,使用RDF三元组的形式存储数据,并通过限定符和参考引用提供基本语句的附加特性和来源。Wikidata记录的COVID-19数据具有多种可获取途径和较高的准确性,但在数据及时性和完整性方面有待进一步完善。 展开更多
关键词 wikidata COVID-19 信息组织 COVIWD
下载PDF
基于因果链求解算法的人物关系挖掘研究——以Wikidata知识库为例 被引量:5
3
作者 贾君枝 冯婕 《情报学报》 CSSCI CSCD 北大核心 2017年第3期221-230,共10页
人在信息活动中所具有的复杂性决定了大数据时代下人物信息资源的重要程度,因此挖掘人物关系是提高信息资源质量、构建个人实体知识网络、为用户提供知识服务的有效途径。本文将跨领域的因果链求解算法运用到人物亲属关系的挖掘问题中,... 人在信息活动中所具有的复杂性决定了大数据时代下人物信息资源的重要程度,因此挖掘人物关系是提高信息资源质量、构建个人实体知识网络、为用户提供知识服务的有效途径。本文将跨领域的因果链求解算法运用到人物亲属关系的挖掘问题中,并引入罗马亲等计算法衡量不同类型的亲属关系远近,定量地描述了个人实体之间的关联程度,同时采用模糊认知图作为人物关系知识表达模型,最后以Wikidata知识库为实验数据来源,进一步验证该算法的有效性,同时将亲属关联权重值开创性地添加到家族亲属关系图谱的绘制中,并构建了个人实体知识关联模型。本文旨在进一步优化网络环境下的人物信息,实现基于人物关系的知识关联,以期为揭示全方位的人物关系的表示方法提供新视角。 展开更多
关键词 人物关系挖掘 亲属关系 因果链算法 wikidata
下载PDF
基于Wikidata的机构类目范畴树构建与优化 被引量:3
4
作者 贾君枝 叶壮壮 《国家图书馆学刊》 CSSCI 北大核心 2018年第1期56-64,共9页
本文以Wikidata知识库为数据来源,抽取其中的机构数据,利用各机构的subclass of和instance of属性构建机构类目范畴树,以定量分析方法揭示其在类目、实例以及深度上的数量特征,并发现机构类目范畴树存在的三个问题,即机构类实体与其他... 本文以Wikidata知识库为数据来源,抽取其中的机构数据,利用各机构的subclass of和instance of属性构建机构类目范畴树,以定量分析方法揭示其在类目、实例以及深度上的数量特征,并发现机构类目范畴树存在的三个问题,即机构类实体与其他实体类型重叠、机构类目层级混乱以及类目不平衡。在此基础上,提出对机构类目范畴树的优化方法,以设计适用性较强的机构类目体系框架与结构,为解决机构名称层级混乱以及知识共享等问题寻求一条行之有效的途径。 展开更多
关键词 wikidata 机构范畴 信息组织
下载PDF
基于外部ID的中文实体对齐分析——以中国科学院院士Wikidata数据子集为例
5
作者 王瑞云 贾君枝 《国家图书馆学刊》 CSSCI 北大核心 2020年第2期102-112,F0003,共12页
本文尝试解决中文学者命名实体与外部知识库的实体对齐短缺的问题。通过SPARQL语义查询抽取维基数据子图——中国科学院院士的知识图谱子图,初步构建国内知识库的中文院士实体与Wikidata实体的对齐以及与外部ID对应的知识库的实体对齐... 本文尝试解决中文学者命名实体与外部知识库的实体对齐短缺的问题。通过SPARQL语义查询抽取维基数据子图——中国科学院院士的知识图谱子图,初步构建国内知识库的中文院士实体与Wikidata实体的对齐以及与外部ID对应的知识库的实体对齐。对院士实体的三个数量型特征对齐的外部ID个数(ids)、不同语种的Wikipedia站点个数(sites)、实体的全部陈述个数(states)与目标分类(有无VIAF实体对齐)的相关分析发现,目标分类与ids特征正向相关最强,直接VIAF实体对齐只存在ids高区的院士,占比偏低。因此,提出利用LC、ISNI等外部ID,应用VIAF对重要来源库的重定向功能,构建间接的VIAF实体对齐的方法。本文为中文知识库进行外部实体对齐提供了可行的初步方案,提出的实验方法显著地提高了较小ids值(1-7)的院士拥有VIAF实体对齐的个数,最终通过实体对齐的VIAF信息集成增加了院士实体的ids数量,丰富了中文学者与外部知识库的实体对齐信息。图4。表5。参考文献19。 展开更多
关键词 外部ID wikidata VIAF 命名实体对齐
下载PDF
基于Wikidata和标签云的搜索算法研究 被引量:1
6
作者 夏瑀 葛佳琦 +2 位作者 马秀 曹际全 李海巍 《软件导刊》 2016年第8期42-46,共5页
知识库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进行标签化处理,并将转换得到的标签向量应用于信息检索和页面排序。首先,提取Wikidata中的结构化数据,构... 知识库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进行标签化处理,并将转换得到的标签向量应用于信息检索和页面排序。首先,提取Wikidata中的结构化数据,构建以实体为单位的标签云;然后,将需要检索的文档和用户的检索语句映射为相应的标签,并采用处理向量的相关方法实现网页的排序算法;最后,采用信息检索常用的标准对该算法进行验证。实验结果表明,与传统的基于关键词的搜索方法相比,新算法在一定程度上能够提高页面排序的准确率。 展开更多
关键词 知识库 wikidata 网页检索 页面排序 标签云 搜索引擎
下载PDF
Wikidata中数据来源分析 被引量:1
7
作者 寇蕾蕾 《图书馆理论与实践》 CSSCI 2020年第4期67-71,共5页
文章选取人名名称作为研究对象,分析了Wikidata中人物条目的属性及来源的描述能力,并使用数据质量维度评估了来源质量。研究发现:Wikidata使用多个属性对人物条目进行描述,Wikidata人物类来源可靠性不高,Wikidata数据来源本身的质量难... 文章选取人名名称作为研究对象,分析了Wikidata中人物条目的属性及来源的描述能力,并使用数据质量维度评估了来源质量。研究发现:Wikidata使用多个属性对人物条目进行描述,Wikidata人物类来源可靠性不高,Wikidata数据来源本身的质量难以保证。 展开更多
关键词 wikidata 人物条目 数据来源 数据质量
下载PDF
基于标记属性图的Wikidata人物关系可视化数据分析
8
作者 刘鹏鹏 赵占芳 王楠 《新一代信息技术》 2021年第12期13-18,共6页
通过人物关系分析挖掘实体之间的联系,在数据挖掘领域具有重要的研究意义。本文提出了一种基于标记属性图模型的可视化实体关系分析框架,以人物关系分析为研究案例,对诺贝尔化学奖得主的人物关系进行了可视化的实证分析。标记属性图模... 通过人物关系分析挖掘实体之间的联系,在数据挖掘领域具有重要的研究意义。本文提出了一种基于标记属性图模型的可视化实体关系分析框架,以人物关系分析为研究案例,对诺贝尔化学奖得主的人物关系进行了可视化的实证分析。标记属性图模型能够有效的刻画实体之间的关系,便于挖掘实体之间的内在联系。本研究探索了属性图模型在人物关系分析中的应用,为知识发现和关联关系的研究提供了不同的视角。 展开更多
关键词 标记属性图 可视化分析 数据挖掘 wikidata知识库 Neo4j图数据库
下载PDF
基于关联规则的Wikidata人物名称数据分析——以诺贝尔文学奖得主为主题 被引量:3
9
作者 贾君枝 冯婕 《图书情报工作》 CSSCI 北大核心 2017年第12期122-128,共7页
[目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数... [目的 /意义]挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程]提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果 /结论]分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。 展开更多
关键词 名称数据 关联规则 APRIORI算法 知识揭示 wikidata
原文传递
Wikidata属性特征及关系分析 被引量:6
10
作者 贾君枝 崔西燕 《情报科学》 CSSCI 北大核心 2019年第6期80-86,118,共8页
【目的/意义】属性在RDF表示及其数据连接实现中发挥了重要作用。对Wikidata属性的特点、内容进行全方位的研究,旨在揭示属性的使用特征,对于RDF描述中属性的定义、描述、应用具有重要参考价值。【方法/过程】采用归纳总结及比较研究的... 【目的/意义】属性在RDF表示及其数据连接实现中发挥了重要作用。对Wikidata属性的特点、内容进行全方位的研究,旨在揭示属性的使用特征,对于RDF描述中属性的定义、描述、应用具有重要参考价值。【方法/过程】采用归纳总结及比较研究的方法,从术语、约束、声明等方面详细介绍了Wikidata的属性。此外,针对属性间关系各自的特点采用Gephi网状分析工具对其进行深度挖掘。【结果/结论】Wikidata属性具有数据来源多样、协作编辑、逻辑推理的特点,其利用率呈现持续增长的趋势,且各属性之间可以通过一些关系彼此联系,为数据共享和连接实现及其未来数据应用提供了丰富而充分的依据。 展开更多
关键词 wikidata 属性关系 词表
原文传递
Wikidata与名称规范档数据聚合实现 被引量:5
11
作者 贾君枝 赵宇飞 《情报科学》 CSSCI 北大核心 2018年第11期72-77,82,共7页
【目的/意义】明确及优化名称规范档人物职业描述特征,从而丰富人物关系的属性内容,一定程度上为解决同名人物无法识别问题提供参考途径,同时促进实现名称规范档人物数据语义化研究的发展。【方法/过程】详细分析了Wikidata人物条目所... 【目的/意义】明确及优化名称规范档人物职业描述特征,从而丰富人物关系的属性内容,一定程度上为解决同名人物无法识别问题提供参考途径,同时促进实现名称规范档人物数据语义化研究的发展。【方法/过程】详细分析了Wikidata人物条目所蕴含的多种属性内容,并利用向量空间算法,将指向同一人物实体的Wikidata条目与名称规范记录实现匹配和数据元素聚合。【结果/结论】在生成人物实体数据聚合的基础上,构建了D2R三元组映射模型,以重新创建集规范数据和网络资源于一体的人物信息页面,为名称规范记录的深度开放关联提供基础。 展开更多
关键词 wikidata 人物名称 数据聚合 名称规范
原文传递
Wikidata的特点、数据获取与应用 被引量:10
12
作者 贾君枝 薛秋红 《图书情报工作》 CSSCI 北大核心 2016年第17期136-141,148,共7页
[目的 /意义]对Wikidata数据特点、获取方式及其应用进行剖析,旨在带动国内开放数据集的增加,提高国内数据集与国外数据集的关联度。[方法/过程]采用综合归纳及比较研究的方法,阐述Wikidata的发展历程,对其数据特点及数据模型进行研究,... [目的 /意义]对Wikidata数据特点、获取方式及其应用进行剖析,旨在带动国内开放数据集的增加,提高国内数据集与国外数据集的关联度。[方法/过程]采用综合归纳及比较研究的方法,阐述Wikidata的发展历程,对其数据特点及数据模型进行研究,梳理目前可获取Wikidata数据的5种方式。[结果 /结论]Wikidata具有开放、协作、多语言、结构化的特点,其以条目为核心,定义了实体类及属性,提供了多样化数据获取方式,且当前基于Wikidata的应用主要集中在语义检索、多语种查询、知识可视化、知识库构建与虚拟研究环境搭建5个方面。 展开更多
关键词 维基数据 数据获取 应用分析
原文传递
基于潜在语义索引的Wikidata机构实体聚类研究 被引量:1
13
作者 贾君枝 叶壮壮 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第10期56-65,共10页
【目的】Wikidata机构类目范畴树中,存在实例数目过多而使类目的外延过大、不能明确指示及类分资源的问题。为系统化机构名称层级体系,需将这些实例进行划分,使其均衡分布在机构范畴树的各层。【方法】将无监督的层次聚类算法用于解决... 【目的】Wikidata机构类目范畴树中,存在实例数目过多而使类目的外延过大、不能明确指示及类分资源的问题。为系统化机构名称层级体系,需将这些实例进行划分,使其均衡分布在机构范畴树的各层。【方法】将无监督的层次聚类算法用于解决无类别标签的机构实例的自动聚簇问题。为消除机构实体名称中特征词共现对聚类算法的影响,引入Wikidata中机构实体的相关属性作为其上下文环境。同时聚类算法对数据的维度十分敏感,因此采用潜在语义索引作为文本表示模型,通过奇异值分解将高维数据映射到潜在的低维语义空间。【结果】本文方法在实验数据集上的聚类准确率达到87.3%,取得了较好的聚类效果。【局限】仅在小样本数据集上进行验证。【结论】为机构名称提供上下文环境有利于同类机构的聚集,基于潜在语义索引模型的层次聚类算法对于高维度的文本聚类问题是有效的。 展开更多
关键词 机构实体聚类 潜在语义索引 层次聚类 wikidata
原文传递
中文名称规范数据与Wikidata语义关联实现 被引量:3
14
作者 薛秋红 贾君枝 刘会洲 《情报理论与实践》 CSSCI 北大核心 2019年第10期146-150,共5页
[目的/意义]中文名称规范数据与Wikidata的语义整合可以借助网络平台的优势扩大规范数据的共享范围,增加规范数据的价值。[方法/过程]文章采用语义关联的方法,首先将中文名称规范档的数据进行语义化,然后使用PARIS算法,实现了语义化的... [目的/意义]中文名称规范数据与Wikidata的语义整合可以借助网络平台的优势扩大规范数据的共享范围,增加规范数据的价值。[方法/过程]文章采用语义关联的方法,首先将中文名称规范档的数据进行语义化,然后使用PARIS算法,实现了语义化的中文名称规范数据与Wikidata的实体对齐,最后对实体对齐的结果进行评估,并采用数据可视化的方式进行展示。[结果/结论]实验数据对齐的精度为70%,召回率为80%,取得良好的实验效果。 展开更多
关键词 中文名称规范数据 关联数据 维基百科 维基数据 语义关联
原文传递
A Novel Method for Resolving and Completing Authors' Country Affiliation Data in Bibliographic Records 被引量:1
15
作者 Ba Xuan Nguyen Jesse David Dinneen Markus Luczak-Roesch 《Journal of Data and Information Science》 CSCD 2020年第3期97-115,共19页
Purpose: Our work seeks to overcome data quality issues related to incomplete author affiliation data in bibliographic records in order to support accurate and reliable measurement of international research collaborat... Purpose: Our work seeks to overcome data quality issues related to incomplete author affiliation data in bibliographic records in order to support accurate and reliable measurement of international research collaboration(IRC).Design/methodology/approch: We propose, implement, and evaluate a method that leverages the Web-based knowledge graph Wikidata to resolve publication affiliation data to particular countries. The method is tested with general and domain-specific data sets.Findings: Our evaluation covers the magnitude of improvement, accuracy, and consistency. Results suggest the method is beneficial, reliable, and consistent, and thus a viable and improved approach to measuring IRC.Research limitations: Though our evaluation suggests the method works with both general and domain-specific bibliographic data sets, it may perform differently with data sets not tested here. Further limitations stem from the use of the R programming language and R libraries for country identification as well as imbalanced data coverage and quality in Wikidata that may also change over time.Practical implications: The new method helps to increase the accuracy in IRC studies and provides a basis for further development into a general tool that enriches bibliographic data using the Wikidata knowledge graph.Originality: This is the first attempt to enrich bibliographic data using a peer-produced, Webbased knowledge graph like Wikidata. 展开更多
关键词 International research collaboration measurement Bibliographic data Country identification Knowledge graphs wikidata Open data
下载PDF
维基数据条目编纂起源模型构建 被引量:3
16
作者 贾君枝 刘超 《情报理论与实践》 CSSCI 北大核心 2019年第6期71-76,共6页
基于维基技术与理念发展的维基数据,作为知名的结构化开放数据库,不管是在语义Web扩展还是知识库丰富方面都提供了良好的数据获取平台。文章基于PROV-O标准构建条目生命周期编纂起源模型,对维基数据条目历史记录及内容增减变动进行起源... 基于维基技术与理念发展的维基数据,作为知名的结构化开放数据库,不管是在语义Web扩展还是知识库丰富方面都提供了良好的数据获取平台。文章基于PROV-O标准构建条目生命周期编纂起源模型,对维基数据条目历史记录及内容增减变动进行起源分析,总结了条目生命周期内发生的编纂演化过程。借助PROV工具实现了条目编纂起源的RDF化描述,展示了代理和实体维度的起源图可视化,为丰富PROV在领域模型构建以及维基数据条目编纂起源信息在Web和其他异构环境下发布和交换、互操作提供起源支持。 展开更多
关键词 维基数据 数据起源 起源模型 条目编纂
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部