-
题名多特征融合的中文命名实体链接方法研究
被引量:7
- 1
-
-
作者
林泽斐
欧石燕
-
机构
南京大学信息管理学院
福建师范大学社会发展学院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2019年第1期68-78,共11页
-
基金
国家社会科学基金重点项目"基于关联数据的学术文献内容语义发布及其应用研究"(17ATQ001)
-
文摘
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平。
-
关键词
命名实体链接
命名实体消歧
多特征消歧
自然语言处理
-
Keywords
Named Entity Linking
named entity disambiguation
multi-feature disambiguation
natural language processing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-