期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
机构名称规范数据的语义模型构建 被引量:15
1
作者 曾建勋 贾君枝 《大学图书馆学报》 CSSCI 北大核心 2019年第1期42-47,共6页
机构名称数据是科研成果数据库、会议论文数据库、企业业务数据库中必不可少的构成。针对当前机构档规模小、质量低、使用范围有限等缺点,为构建一个有机的机构实体关联网,对机构名称数据呈现的特点进行了分析,从用户需求角度明确机构... 机构名称数据是科研成果数据库、会议论文数据库、企业业务数据库中必不可少的构成。针对当前机构档规模小、质量低、使用范围有限等缺点,为构建一个有机的机构实体关联网,对机构名称数据呈现的特点进行了分析,从用户需求角度明确机构名称实体对象,设计了机构名称的属性及其机构实体间的关系,在此基础上引入Schema词汇表对其进行语义描述,从而确立了机构名称的数据模型。 展开更多
关键词 机构名称 规范数据 语义模型
下载PDF
科研机构名称归一化实现 被引量:13
2
作者 贾君枝 曾建勋 +1 位作者 李捷佳 付晓梅 《图书情报工作》 CSSCI 北大核心 2018年第13期103-110,共8页
[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程... [目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。 展开更多
关键词 科研机构名称 聚类 K-MEANS
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部