摘要
作者重名现象将降低文献检索和网络检索的准确性,影响文献数据搜集质量,增加基于作者个人层面分析评价的障碍。目前国内外学者提出了人工辨识、数据库字段修正、基于机器学习的重名辨识等多种方法来解决作者重名问题。文章总结作者重名辨识面临的问题,分析当前各辨识方法的特点以及不足之处,指明作者重名辨识特别是中国作者重名辨识的发展方向。
Because of name variations, an author may have multiple names and multiple authors may share the same name. Name disambiguation affects the performance of document retrieval, web search, database integration, and may cause improper attribution to authors. This paper makes a thorough investigation of the whole problem, analyses the current characteristics of the various disambiguation methods and points out the direction of name disambiguation development.
出处
《数字图书馆论坛》
2011年第10期60-65,共6页
Digital Library Forum
基金
国家自然科学基金,中国科学技术信息研究所预研项目
关键词
作者重名
机器学习
社会网络
聚类
Name disambiguation, Machine learning, Social network, Clustering