-
题名USPTO专利发明人重名辨识方法综述
被引量:1
- 1
-
-
作者
于永胜
董诚
韩红旗
李仲
-
机构
中国科学技术信息研究所
-
出处
《天津科技》
2018年第2期22-27,共6页
-
基金
国家自然科学基金资助项目“科学合作网络的不连通问题研究”(71473237)
中国工程科技知识中心建设项目“知识组织体系建设”(CKCEST-2017-1-12)
中国科学技术信息研究所创新研究基金面上项目“基于词系统的知识服务平台应用示范”(MS2017-03)的资助
-
文摘
英文专利发明人姓名歧义现象越来越严重,极大阻碍了英文专利数据的研究应用。为了解英文专利发明人重名辨识方法的研究现状,进行了方法调研和总结:首先,介绍专利发明人重名辨识研究的意义及困难;其次,对国内外现有的专利发明人重名辨识方法进行梳理,主要将其分为基于规则的方法和基于机器学习的方法;最后,对发明人重名辨识方法的优缺点进行总结分析,并对未来方法研究进行展望。建议将深度学习算法和语义指纹算法融入到专利发明人重名辨识方法中,以便更加高效准确地进行发明人重名辨识。
-
关键词
重名辨识
机器学习
语义指纹
聚类
-
Keywords
name disambiguation
machine learning
semantic fingerprint
clustering
-
分类号
G35
[文化科学—情报学]
-
-
题名数据缺失时基于BP神经网络的作者重名辨识研究
被引量:7
- 2
-
-
作者
柯昊
李天
周悦
钟玉颖
俞征鹿
袁军鹏
-
机构
中央财经大学
中国科学技术信息研究所
中国科学院文献情报中心
中国科学院大学经济与管理学院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2018年第6期600-609,共10页
-
基金
国家自然科学基金面上项目"中英文论文中的中国作者姓名消歧研究"(71473236)
-
文摘
作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效。针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度"。设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性。
-
关键词
重名辨识
数据缺失
BP神经网络
科学计量学
-
Keywords
author name disambiguation
missing data
BP neural network
scientometrics
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-