期刊文献+
共找到157篇文章
< 1 2 8 >
每页显示 20 50 100
A Multi-match Approach to the Author Uncertainty Problem
1
作者 Stephen F.Carley Alan L.Porter Jan L.Youtie 《Journal of Data and Information Science》 CSCD 2019年第2期1-18,共18页
Purpose: The ability to identify the scholarship of individual authors is essential for performance evaluation. A number of factors hinder this endeavor. Common and similarly spelled surnames make it difficult to isol... Purpose: The ability to identify the scholarship of individual authors is essential for performance evaluation. A number of factors hinder this endeavor. Common and similarly spelled surnames make it difficult to isolate the scholarship of individual authors indexed on large databases. Variations in name spelling of individual scholars further complicates matters. Common family names in scientific powerhouses like China make it problematic to distinguish between authors possessing ubiquitous and/or anglicized surnames(as well as the same or similar first names). The assignment of unique author identifiers provides a major step toward resolving these difficulties. We maintain, however, that in and of themselves, author identifiers are not sufficient to fully address the author uncertainty problem. In this study we build on the author identifier approach by considering commonalities in fielded data between authors containing the same surname and first initial of their first name. We illustrate our approach using three case studies.Design/methodology/approach: The approach we advance in this study is based on commonalities among fielded data in search results. We cast a broad initial net—i.e., a Web of Science(WOS) search for a given author's last name, followed by a comma, followed by the first initial of his or her first name(e.g., a search for ‘John Doe' would assume the form: ‘Doe, J'). Results for this search typically contain all of the scholarship legitimately belonging to this author in the given database(i.e., all of his or her true positives), along with a large amount of noise, or scholarship not belonging to this author(i.e., a large number of false positives). From this corpus we proceed to iteratively weed out false positives and retain true positives. Author identifiers provide a good starting point—e.g., if ‘Doe, J' and ‘Doe, John' share the same author identifier, this would be sufficient for us to conclude these are one and the same individual. We find email addresses similarly adequate—e.g., if two author names which share the same surname and same first initial have an email address in common, we conclude these authors are the same person. Author identifier and email address data is not always available, however. When this occurs, other fields are used to address the author uncertainty problem.Commonalities among author data other than unique identifiers and email addresses is less conclusive for name consolidation purposes. For example, if ‘Doe, John' and ‘Doe, J' have an affiliation in common, do we conclude that these names belong the same person? They may or may not; affiliations have employed two or more faculty members sharing the same last and first initial. Similarly, it's conceivable that two individuals with the same last name and first initial publish in the same journal, publish with the same co-authors, and/or cite the same references. Should we then ignore commonalities among these fields and conclude they're too imprecise for name consolidation purposes? It is our position that such commonalities are indeed valuable for addressing the author uncertainty problem, but more so when used in combination.Our approach makes use of automation as well as manual inspection, relying initially on author identifiers, then commonalities among fielded data other than author identifiers, and finally manual verification. To achieve name consolidation independent of author identifier matches, we have developed a procedure that is used with bibliometric software called VantagePoint(see www.thevantagepoint.com). While the application of our technique does not exclusively depend on VantagePoint, it is the software we find most efficient in this study. The script we developed to implement this procedure is designed to implement our name disambiguation procedure in a way that significantly reduces manual effort on the user's part. Those who seek to replicate our procedure independent of VantagePoint can do so by manually following the method we outline, but we note that the manual application of our procedure takes a significant amount of time and effort, especially when working with larger datasets.Our script begins by prompting the user for a surname and a first initial(for any author of interest). It then prompts the user to select a WOS field on which to consolidate author names. After this the user is prompted to point to the name of the authors field, and finally asked to identify a specific author name(referred to by the script as the primary author) within this field whom the user knows to be a true positive(a suggested approach is to point to an author name associated with one of the records that has the author's ORCID iD or email address attached to it).The script proceeds to identify and combine all author names sharing the primary author's surname and first initial of his or her first name who share commonalities in the WOS field on which the user was prompted to consolidate author names. This typically results in significant reduction in the initial dataset size. After the procedure completes the user is usually left with a much smaller(and more manageable) dataset to manually inspect(and/or apply additional name disambiguation techniques to).Research limitations: Match field coverage can be an issue. When field coverage is paltry dataset reduction is not as significant, which results in more manual inspection on the user's part. Our procedure doesn't lend itself to scholars who have had a legal family name change(after marriage, for example). Moreover, the technique we advance is(sometimes, but not always) likely to have a difficult time dealing with scholars who have changed careers or fields dramatically, as well as scholars whose work is highly interdisciplinary.Practical implications: The procedure we advance has the ability to save a significant amount of time and effort for individuals engaged in name disambiguation research, especially when the name under consideration is a more common family name. It is more effective when match field coverage is high and a number of match fields exist.Originality/value: Once again, the procedure we advance has the ability to save a significant amount of time and effort for individuals engaged in name disambiguation research. It combines preexisting with more recent approaches, harnessing the benefits of both.Findings: Our study applies the name disambiguation procedure we advance to three case studies. Ideal match fields are not the same for each of our case studies. We find that match field effectiveness is in large part a function of field coverage. Comparing original dataset size, the timeframe analyzed for each case study is not the same, nor are the subject areas in which they publish. Our procedure is more effective when applied to our third case study, both in terms of list reduction and 100% retention of true positives. We attribute this to excellent match field coverage, and especially in more specific match fields, as well as having a more modest/manageable number of publications.While machine learning is considered authoritative by many, we do not see it as practical or replicable. The procedure advanced herein is both practical, replicable and relatively user friendly. It might be categorized into a space between ORCID and machine learning. Machine learning approaches typically look for commonalities among citation data, which is not always available, structured or easy to work with. The procedure we advance is intended to be applied across numerous fields in a dataset of interest(e.g. emails, coauthors, affiliations, etc.), resulting in multiple rounds of reduction. Results indicate that effective match fields include author identifiers, emails, source titles, co-authors and ISSNs. While the script we present is not likely to result in a dataset consisting solely of true positives(at least for more common surnames), it does significantly reduce manual effort on the user's part. Dataset reduction(after our procedure is applied) is in large part a function of(a) field availability and(b) field coverage. 展开更多
关键词 name DISAMBIGUATION author identifiers Multi-match APPROACH
下载PDF
Chinese Journal of Oceanology and Limnology Instructions to authors
2
《Chinese Journal of Oceanology and Limnology》 SCIE CAS CSCD 1995年第1期97-97,共1页
To be placed on the lower part of the title page,or on a separatepage.It should be no longer than 5% of the article.
关键词 To include the TITLE of the paper name of the author INSTITUTION (affiliation) city.
下载PDF
基于作者和研究主题的科研机构名称演化关系识别研究 被引量:1
3
作者 胡潜 吴茜 +1 位作者 董寒宇 李静 《情报学报》 CSCD 北大核心 2023年第11期1289-1299,共11页
因机构发展变迁而引发的科研机构名称演化,严重影响了基于机构名称所开展的信息检索、科研评价等知识服务的质量和效果。为此,本文提出了一种基于作者和研究主题的科研机构名称演化关系识别方法,以消解科研机构名称间的异质性,实现科研... 因机构发展变迁而引发的科研机构名称演化,严重影响了基于机构名称所开展的信息检索、科研评价等知识服务的质量和效果。为此,本文提出了一种基于作者和研究主题的科研机构名称演化关系识别方法,以消解科研机构名称间的异质性,实现科研机构名称归一化。通过对科研机构名称演化在学术论文署名中的表现分析,本文构建了基于作者和研究主题的科研机构名称演化关系识别模型,对科研机构名称间的改名、拆分、合并和重组关系进行了识别,并基于小规模的学术论文数据对模型效果进行了验证。研究结果表明,本文提出的科研机构名称演化关系识别方法在一级和二级科研机构名称演化关系的识别中均能达到较好的准确率和召回率,并能够识别出一般性冷门科研机构之间的名称演化关系。 展开更多
关键词 机构名称 名称规范化 作者共现度 研究主题相似度
下载PDF
国内外名称规范控制向身份管理转型的研究进展
4
作者 陈辰 刘雁 《大学图书馆学报》 北大核心 2023年第4期98-110,共13页
图书馆编目社区正处于从传统的规范控制向身份管理过渡的关键时期,系统调研和梳理国内外名称规范控制向身份管理转型的相关理论和实践议题,可以为深入系统研究转型的理论逻辑和方法路径奠定基础。文章将各类专业数据库和网络搜索引擎作... 图书馆编目社区正处于从传统的规范控制向身份管理过渡的关键时期,系统调研和梳理国内外名称规范控制向身份管理转型的相关理论和实践议题,可以为深入系统研究转型的理论逻辑和方法路径奠定基础。文章将各类专业数据库和网络搜索引擎作为数据检索获取途径,系统总结名称规范向身份管理转型的研究与实践议题。研究表明,国内外都聚焦名称标目到唯一标识符的转变趋势研究,并对规范数据的关联数据化转换和链接进行了积极探索;在书目/规范记录与外部标识符的融合方面以及基于外部标识符实施名称规范控制的实践探索方面,国外进行了更为专门系统性的研究,国内尚处于外部标识符系统的概述性研究阶段,尚缺乏针对中文行为者实体的身份管理探索实践。未来研究需要进一步完善指导转型的理论体系、构建支撑转型的标准规范以及探索实施转型的方法路径。 展开更多
关键词 规范控制 身份管理 名称标目 唯一标识符
下载PDF
基于元路径的作者名称协同消歧研究
5
作者 杨昭 《情报学报》 CSCD 北大核心 2023年第3期327-340,共14页
大数据时代,面向文献网络数据治理和学术成果精准归属,应对作者名称多样性和歧义性的双重挑战,从异质共现网络视角,提出基于元路径的作者名称消歧方法,尝试解决因作者及其归属机构的同名、更名、异名共存伴生难以协同消歧的问题。采用... 大数据时代,面向文献网络数据治理和学术成果精准归属,应对作者名称多样性和歧义性的双重挑战,从异质共现网络视角,提出基于元路径的作者名称消歧方法,尝试解决因作者及其归属机构的同名、更名、异名共存伴生难以协同消歧的问题。采用作者名称与机构名称协同策略,将作者名称消歧问题转化为异质网络挖掘问题,构建基于元路径的作者名称消歧框架;结合对象间的语义、空间关联关系,构建作者异质共现网络模型;提出基于元路径的多名聚合、重名消解和机构归一方法,计算名称相似度和困惑度,识别隐性语义关系。以同一机构下的英文论文数据集和单一重名下的中文论文数据集为例,通过实验验证了该方法的有效性。 展开更多
关键词 作者名称 重名消解 协同消歧 元路径 大数据
下载PDF
中文机构名称规范库建设的实践与分析——以“中科院机构名称规范库”建设为例 被引量:14
6
作者 李慧佳 马建玲 +1 位作者 张秀秀 杨丽娜 《图书与情报》 CSSCI 北大核心 2016年第1期133-139,共7页
由于体制改革更名和中西文名称的简写、缩写等原因,许多中文机构名称存在不统一和不规范表述的问题,这对这些机构相关资源、学术成果的定位检索、共享与统计将造成一定的影响。文章通过概述和分析"中科院机构名称规范库"建设... 由于体制改革更名和中西文名称的简写、缩写等原因,许多中文机构名称存在不统一和不规范表述的问题,这对这些机构相关资源、学术成果的定位检索、共享与统计将造成一定的影响。文章通过概述和分析"中科院机构名称规范库"建设的思路、内容与服务,认为我国的中文机构名称规范库建设应在规范控制的全面性、规范标准的制定、与前沿技术的融合及可持续性建设等方面予以重视与发展。 展开更多
关键词 规范控制 名称规范 关联数据 知识资源 中科院机构名称规范库
下载PDF
我国图情领域名称规范文献计量研究 被引量:17
7
作者 刘琨 李春利 白福春 《图书馆工作与研究》 CSSCI 北大核心 2017年第12期66-71,共6页
名称规范是实现信息统一检索、提升查全率的重要途径。本文基于对1984年以来图情领域名称规范相关论文的统计,从文献计量学的角度,利用普赖斯定律、词频统计等进行分析,揭示我国图情领域名称规范研究的论文增长规律、期刊和地区分布状... 名称规范是实现信息统一检索、提升查全率的重要途径。本文基于对1984年以来图情领域名称规范相关论文的统计,从文献计量学的角度,利用普赖斯定律、词频统计等进行分析,揭示我国图情领域名称规范研究的论文增长规律、期刊和地区分布状况、核心作者群、研究热点及未来发展方向。 展开更多
关键词 名称规范 图情领域 文献计量学 文献研究
下载PDF
中文名称规范文档与虚拟国际规范文档的共享问题研究 被引量:20
8
作者 贾君枝 石燕青 《中国图书馆学报》 CSSCI 北大核心 2014年第6期83-92,共10页
随着规范控制工作的国际化,国际名称规范文档共建共享成为必然趋势。本文对影响名称规范文档共享的要素——名称规范文档遵循的编目规则、采用的描述格式和数据元素构成的差异进行分析,基于虚拟国际规范文档(VIAF)匹配思路,通过中国高... 随着规范控制工作的国际化,国际名称规范文档共建共享成为必然趋势。本文对影响名称规范文档共享的要素——名称规范文档遵循的编目规则、采用的描述格式和数据元素构成的差异进行分析,基于虚拟国际规范文档(VIAF)匹配思路,通过中国高等教育文献保障系统管理中心(CALIS)、香港中文名称规范数据库(HKCAN)和VIAF的数据匹配实验,分析当前国内规范文档存在的问题:名称规范文档记录不全,检索结果输出不按相关度排列,国内各机构对中国人名的拼音标目不规范。本文在控制规则、附加信息、数据模型等方面提出相应对策,以提高文档的共享效率,希望能为推动我国规范控制工作的国际化进程提供参考。 展开更多
关键词 名称规范文档 中文名称规范文档 虚拟国际规范文档 数据匹配
下载PDF
元数据语义化映射过程研究——以中科院机构名称规范控制库为例 被引量:5
9
作者 李慧佳 马建玲 +1 位作者 张秀秀 王楠 《图书馆论坛》 CSSCI 北大核心 2017年第12期72-79,共8页
元数据语义化映射是实现数据库或系统语义互操作的基础。文章结合元数据语义描述标准和元数据语义化映射方法,对元数据的语义映射过程进行分阶段描述,主要包括元数据集识别、数据元素分组和语义映射三个阶段。文章以中科院机构名称规范... 元数据语义化映射是实现数据库或系统语义互操作的基础。文章结合元数据语义描述标准和元数据语义化映射方法,对元数据的语义映射过程进行分阶段描述,主要包括元数据集识别、数据元素分组和语义映射三个阶段。文章以中科院机构名称规范控制库的元数据语义化映射进行实证研究,佐证标准化的元数据语义映射过程对今后特定领域的信息资源共享和交换具有指导意义。 展开更多
关键词 元数据 语义化 映射 名称规范 机构名称
下载PDF
清华大学图书馆INNOPAC系统中规范库(名称规范)的建立 被引量:9
10
作者 李凤侠 刘春红 《图书馆建设》 北大核心 2002年第5期49-51,共3页
名称规范是规范工作的重要组成部分 ,经过清华大学图书馆规范库 (名称规范 )建立的具体实践 ,作者从规范文档建立的原则、收录的范围、建立的过程、规范记录的格式、建立名称规范存在的主要问题及对今后发展的建议五方面进行了深入的探... 名称规范是规范工作的重要组成部分 ,经过清华大学图书馆规范库 (名称规范 )建立的具体实践 ,作者从规范文档建立的原则、收录的范围、建立的过程、规范记录的格式、建立名称规范存在的主要问题及对今后发展的建议五方面进行了深入的探讨和总结。 展开更多
关键词 清华大学图书馆 INNOPAC系统 规范文档 名称规范 规范记录 编目工作
下载PDF
中文个人名称规范文档的关联数据化研究 被引量:16
11
作者 贾君枝 石燕青 《情报学报》 CSSCI 北大核心 2016年第7期696-703,共8页
本文提出人名规范数据语义描述的模型框架,以国家图书馆的中文个人名称数据为对象,研究了名称规范文档发布为关联数据的问题。以Drupal为工具,根据发布关联数据的步骤将MARC格式的人名规范数据转换为RDF格式,并与外部资源进行连接,以期... 本文提出人名规范数据语义描述的模型框架,以国家图书馆的中文个人名称数据为对象,研究了名称规范文档发布为关联数据的问题。以Drupal为工具,根据发布关联数据的步骤将MARC格式的人名规范数据转换为RDF格式,并与外部资源进行连接,以期为名称规范数据的语义化提供参考,使名称规范数据成为关联开放数据社区的一部分,更好地实现数据共享。 展开更多
关键词 个人名称规范 语义描述 关联数据
下载PDF
科技期刊中刊名人名地名汉语拼音存在问题分析 被引量:8
12
作者 王鑫 李维 《编辑学报》 CSSCI 北大核心 2002年第4期262-263,共2页
从 10 0种科技期刊的刊名、人名、地名汉语拼音拼写情况的调查结果看出 ,有的期刊能按国家标准拼写 ,有的期刊没有达到标准要求。
关键词 问题 科技期刊 刊名 人名 地名 汉语拼音
下载PDF
责任者唯一标识符构建及其面临的主要问题 被引量:9
13
作者 陈辰 宋文 《图书馆论坛》 CSSCI 北大核心 2013年第2期125-129,151,共6页
为责任者制定唯一标识符是网络环境下进行人名规范控制有效方法。文章通过调研责任者唯一标识符系统构建的背景和研究现状,分析各自系统的特点,总结目前责任者唯一标识符构建过程存在的突出问题,主要包括构建模式、技术因素、人名识别... 为责任者制定唯一标识符是网络环境下进行人名规范控制有效方法。文章通过调研责任者唯一标识符系统构建的背景和研究现状,分析各自系统的特点,总结目前责任者唯一标识符构建过程存在的突出问题,主要包括构建模式、技术因素、人名识别、责任者诚信和元数据信息构建和应用等,并提出解决这些问题的建议。 展开更多
关键词 人名规范 责任者 唯一标识符
下载PDF
国家图书馆中文书目规范控制现状及研究 被引量:10
14
作者 卜书庆 郝嘉树 《图书馆论坛》 CSSCI 北大核心 2010年第6期209-213,共5页
对国家图书馆规范数据库建设情况、规范控制模式及问题、名称规范标目问题和未实施名称规范控制进行分析和研究,并提出相关建议,目的是对书目规范控制理论和应用进行研究,从而为我国文献组织更好地开展书目规范控制工作提供经验。
关键词 国家图书馆 书目规范控制 名称与主题规范
下载PDF
学术论文作者机构规范文档构建~ 被引量:7
15
作者 孙海霞 李军莲 《医学信息学杂志》 CAS 2015年第11期42-47,共6页
以中国生物医学文献数据库为基础,面向基于学术论文开展机构检索、分析与评价相关知识服务需要,对学术论文作者机构名称规范目标与内容、体系结构与组织方式以及构建过程与实现策略进行研究、实践总结。
关键词 中国生物医学文献数据库 机构名称规范 规范文档结构 社会化协作 计算机辅助环境
下载PDF
FRAD与中文名称规范控制之研究 被引量:3
16
作者 朱青青 孙凤玲 《国家图书馆学刊》 CSSCI 北大核心 2012年第2期19-22,共4页
通过对FRAD概念模型的研究,结合中文名称规范控制实践中的问题,分析了FRAD概念模型中,实体定义、实体属性、实体关系、用户任务四个方面带给实践工作的一些启示,希望通过对这些具体问题的解决,能够进一步推动规范控制工作的开展,并促进F... 通过对FRAD概念模型的研究,结合中文名称规范控制实践中的问题,分析了FRAD概念模型中,实体定义、实体属性、实体关系、用户任务四个方面带给实践工作的一些启示,希望通过对这些具体问题的解决,能够进一步推动规范控制工作的开展,并促进FRAD在规范控制实践中的全面应用。 展开更多
关键词 FRAD 中文名称 规范控制 实体 用户任务
下载PDF
中文名称规范数据的维护与整合 被引量:5
17
作者 王彦侨 王广平 《图书馆杂志》 CSSCI 北大核心 2017年第2期56-59,共4页
我国中文书目规范控制已有几十年的时间,积累了一些经验,但仍处于初步发展阶段。在规范控制的过程中,中国的图书馆在机读格式、标目、名称附加等方面均存在共性和差异。对此,应当统一规则、加强合作,让全国同仁共同参与名称规范库的建设... 我国中文书目规范控制已有几十年的时间,积累了一些经验,但仍处于初步发展阶段。在规范控制的过程中,中国的图书馆在机读格式、标目、名称附加等方面均存在共性和差异。对此,应当统一规则、加强合作,让全国同仁共同参与名称规范库的建设,推动中文书目数据和规范数据质量的提高。 展开更多
关键词 中文名称规范 书目控制 数据整合
下载PDF
清华大学图书馆名称规范数据的著录探讨 被引量:2
18
作者 刘春红 李凤侠 杨慧 《现代图书情报技术》 CSSCI 北大核心 2005年第2期67-70,共4页
根据《中文图书名称规范数据款目著录规则》,结合清华大学图书馆INNOPAC系统规范数据模块 中规范记录字段的特点,探讨了本馆中文名称规范记录主要字段的著录要点、对编目工作提出的新要求及建立 规范记录时的注意事项。
关键词 名称规范 规范记录 机读格式
下载PDF
中文名称规范文档与VIAF的关联 被引量:3
19
作者 贾君枝 石燕青 《国家图书馆学刊》 CSSCI 北大核心 2014年第6期85-90,共6页
随着计算机技术的广泛应用,各个图书馆的规范控制工作从彼此独立逐渐走向合作。由于各国图书馆的规范文档差异很大,协作规范控制开始向整合已有数据的方向发展。借鉴现有的分布式、关联式、中心式、中心链接式四种连接虚拟国际规范档的... 随着计算机技术的广泛应用,各个图书馆的规范控制工作从彼此独立逐渐走向合作。由于各国图书馆的规范文档差异很大,协作规范控制开始向整合已有数据的方向发展。借鉴现有的分布式、关联式、中心式、中心链接式四种连接虚拟国际规范档的模型,本文建立了多馆中心式模型,整合国内多家机构的规范文档,对未来中文名称规范文档如何加入虚拟国际规范档进行了探索。 展开更多
关键词 VIAF 虚拟国际规范档 中文名称规范文档 连接模型
下载PDF
外国人姓名特点及其在CNMARC个人名称字段的规范标目 被引量:7
20
作者 管蔚华 《大学图书馆学报》 CSSCI 北大核心 2001年第4期80-82,共3页
文章从文化、历史的角度分析了世界各种语言国家人名的构成特点, 具体探讨了几种常用语言外国人姓名在CNMARC个人名称字段的规范标目问题。
关键词 CNMARC 个人名称字段 文献编目 名称规范 姓名 外国人
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部