提出一种基于BERT(bidirectional encoder representations from transformers)和TextRank关键词提取的实体链接方法。将BERT预训练语言模型引入实体链接任务,进行实体指称上下文和候选实体相关信息的关联度分析,通过提升语义分析的效...提出一种基于BERT(bidirectional encoder representations from transformers)和TextRank关键词提取的实体链接方法。将BERT预训练语言模型引入实体链接任务,进行实体指称上下文和候选实体相关信息的关联度分析,通过提升语义分析的效果来增强实体链接的结果。采用TextRank关键词提取技术增强目标实体综合描述信息的主题信息,增强文本相似度度量的准确性,从而优化模型效果。使用CCKS2019评测任务二的数据集对模型效果进行验证,实验结果表明,所提方法的实体链接效果明显优于其他实体链接方法,能有效解决实体链接问题。展开更多
本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这...本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这两个构式中搭配词的语义倾向在1900年后均呈现出明显的变化,从而使节点词具有明确的语义分工——seem to多与“认知–施事类”动词连用,表示语言使用者对客观发生事件的主观情感态度,而appear to则主要表现为写实的用法,用于描述可直接感知的物质世界中发生的事件或是客观实体的性质和状态,并逐渐倾向于与静态动词连用。展开更多
文摘提出一种基于BERT(bidirectional encoder representations from transformers)和TextRank关键词提取的实体链接方法。将BERT预训练语言模型引入实体链接任务,进行实体指称上下文和候选实体相关信息的关联度分析,通过提升语义分析的效果来增强实体链接的结果。采用TextRank关键词提取技术增强目标实体综合描述信息的主题信息,增强文本相似度度量的准确性,从而优化模型效果。使用CCKS2019评测任务二的数据集对模型效果进行验证,实验结果表明,所提方法的实体链接效果明显优于其他实体链接方法,能有效解决实体链接问题。
文摘本研究以“seem to V”和“appear to V”这两个近义链接动词构式为例,借助COCA、COHA语料库及R软件,通过基于类符的语义向量空间模型、聚类分析和对应分析三种可视化手段,对二者在美式英语中的语义变化情况进行定量研究。结果表明:这两个构式中搭配词的语义倾向在1900年后均呈现出明显的变化,从而使节点词具有明确的语义分工——seem to多与“认知–施事类”动词连用,表示语言使用者对客观发生事件的主观情感态度,而appear to则主要表现为写实的用法,用于描述可直接感知的物质世界中发生的事件或是客观实体的性质和状态,并逐渐倾向于与静态动词连用。