-
题名基于实体级联类型的中文关系抽取管道模型
- 1
-
-
作者
饶东宁
吴倩梅
黄观琚
-
机构
广东工业大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第9期2685-2689,共5页
-
基金
广东省自然科学基金面上项目(2021A1515012556)。
-
文摘
端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时具有多个类型,这种多义性的情况在中文数据集中尤为常见。为解决上述问题,提出了一种实体级联类型机制,并在此基础上开发了一个更适合中文关系抽取的管道模型,取名为CENTRELINE。该流水线方法的实体模块是一个词-词关系分类模型,它以BERT和双向LSTM作为编码器、经过条件层归一化后引入空洞卷积,最后通过级联类型预测器输出实体及其级联类型。关系模块的输入仅由实体模块构建。该方法在DuIE1.0、DuIE2.0和CMeIE-V2数据集上的F_(1)值分别比基线方法提高了7.23、6.93和8.51百分点,并在DuIE1.0和DuIE2.0数据集上都实现了最先进的性能。消融实验表明,提出的级联类型机制和根据中文语言特征改进的管道模型,均对关系抽取性能具有明显的促进作用。
-
关键词
中文关系抽取
管道模型
空洞卷积
实体级联类型
-
Keywords
Chinese relation extraction
pipeline model
dilated convolution
entity cascading type
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-