-
题名一种基于概率主题模型的命名实体链接方法
被引量:32
- 1
-
-
作者
怀宝兴
宝腾飞
祝恒书
刘淇
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期2076-2087,共12页
-
基金
国家杰出青年科学基金(61325010)
国家高技术研究发展计划(863)(2014AA015203)
+3 种基金
安徽省科技专项资金(13Z02008-5)
安徽省国际科技合作计划(1303063008)
安徽省科技攻关计划(1301022064)
安徽省自然科学基金(1408085QF110)
-
文摘
命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如"苹果"既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.
-
关键词
命名实体链接
概率主题模型
维基百科
-
Keywords
named entity linking
probabilistic topic models
Wikipedia
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名多特征融合的中文命名实体链接方法研究
被引量:7
- 2
-
-
作者
林泽斐
欧石燕
-
机构
南京大学信息管理学院
福建师范大学社会发展学院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2019年第1期68-78,共11页
-
基金
国家社会科学基金重点项目"基于关联数据的学术文献内容语义发布及其应用研究"(17ATQ001)
-
文摘
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平。
-
关键词
命名实体链接
命名实体消歧
多特征消歧
自然语言处理
-
Keywords
Named Entity Linking
named entity disambiguation
multi-feature disambiguation
natural language processing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-