-
题名基于短语级注意力机制的关系抽取方法
被引量:2
- 1
-
-
作者
尹鹏
周林
郭强
刘镇江
-
机构
江南计算技术研究所
-
出处
《计算机技术与发展》
2019年第9期24-30,共7页
-
基金
核高基项目基金(2015ZX01040-201)
-
文摘
关系抽取是自然语言处理的重要研究内容,是知识图谱构建的关键技术。目前,在神经网络中引入注意力机制进行关系抽取成为主流方法,现有方法一般结合句子单词和实体相关性计算注意力,没有考虑短语和实体关系之间的相关性,并且对实体信息利用不够充分。针对该问题,提出基于短语级注意力机制的关系抽取方法。首先用卷积层对词向量做卷积,以滑动窗口的方式得到短语级的向量表示,然后利用短语与实体关系之间的相关性计算注意力。为了使实体信息利用更充分,用卷积层和池化层分别提取实体短语的深度特征表示,并引入TransE的思想表示两个实体关系的特征。最后,采用分段池化方法得到深度特征。为了减少远程监督中错误标签的干扰,使用标签平滑正则化(LSR)把原来的“硬”标签改为“软”标签。实验结果表明,该方法能够有效利用短语信息和实体关系信息,对实体关系抽取效果有较大的提升。
-
关键词
关系抽取
远程监督
分段卷积神经网络
注意力机制
transe方法
标签平滑正则化
-
Keywords
relation extraction
distant supervision
PCNN
attention mechanism
transe
label smoothing regularization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-