-
题名文档上下文异构表示的句子级关系抽取方法
- 1
-
-
作者
曹渝昆
程宇
何祯奕
徐康乐
颜家洛
李云峰
-
机构
上海电力大学计算机科学与技术学院
中国商飞上海航空工业(集团)有限公司信息中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第5期111-119,共9页
-
基金
上海市自然科学基金(20ZR1421600)。
-
文摘
关系抽取是指从文本中识别2个实体的关系。现有研究利用数据分组处理取得了良好的效果,但由于组内数据之间交互较少,因此大多忽略了组内数据之间的关联。此外,部分方法定义了较多种类的标注信息,从而导致标注信息冗余。针对上述问题,提出一种文档上下文异构表示的句子级关系抽取方法。设计基于异构图网络的文档上下文信息模块,将组内数据中的词和关系建模为图上的节点,然后通过消息传递机制将组内信息进行交互,充分表征组内数据间的关联关系;设计基于异构图网络的关系信息模块用于捕捉关系信息,其与文档上下文信息模块中异构图网络参数共享,从而节约了计算资源;设计融合标记策略,引入一种逻辑上的虚拟标签减少标签种类,缓解标注信息冗余问题。实验结果表明,所构建模型在NYT和WebNLG数据集上的F1值分别为93.2%和94.7%,在复杂场景下的8个子任务中,取得了6个子任务的最优表现,验证了所提方法的有效性。
-
关键词
融合标记
异构图网络
单模块单步模型
句子级关系抽取
自然语言处理
-
Keywords
fusion labeling
heterogeneous graph network
one-module one-step model
sentence-level relation extraction
natural language processing
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-