-
题名针对长距离实体的双图路径推理模型
- 1
-
-
作者
祝涛杰
卢记仓
周刚
皮乾坤
丁肖摇
-
机构
信息工程大学
-
出处
《信息工程大学学报》
2024年第3期272-277,共6页
-
基金
河南省自然科学基金(222300420590)。
-
文摘
文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好的双图模型。首先,采用启发式规则提取提及交互和证据句,并基于此构建基于证据句的提及图和实体图;其次,利用注意力机制捕获实体图中实体节点之间的推理路径;最后,根据推理路径,采用合适的评分函数预测实体关系事实。在文档级通用领域数据集DocRED中的实验表明,所提模型取得了较好的效果。
-
关键词
文档级关系抽取
图神经网络
注意力机制
-
Keywords
document-level relation extraction
graph neural network
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名文档级关系抽取技术研究综述
被引量:4
- 2
-
-
作者
祝涛杰
卢记仓
周刚
丁肖摇
王凌
朱秀宝
-
机构
战略支援部队信息工程大学
数学工程与先进计算国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2023年第5期189-200,共12页
-
基金
河南省自然科学基金(222300420590)。
-
文摘
关系抽取是信息抽取研究的重要方向,已逐步从句子级扩展到了文档级。与句子相比,文档通常蕴含更多的关系事实,可为知识库构建、信息检索和语义分析等提供更多的信息支持。然而,文档级关系抽取复杂度更高,难度更大,目前缺乏较为系统全面的梳理和总结。为更好地促进文档级关系抽取的深入研究与发展,文中对已有技术和方法进行了综合深入分析,从数据预处理方式和核心算法角度,将已有文档级关系抽取研究大致分为基于树、基于序列和基于图3种类别;在此基础上,分析描述了各类研究中的部分典型方法、最新进展以及存在的不足;同时,介绍了现有研究中部分常用数据集和性能评价指标,并列出了已有部分典型方法的具体性能;最后,对现有文档级关系抽取研究存在的问题进行了分析和总结,指出了未来可能的发展趋势及可进一步深入关注的研究方向。
-
关键词
信息抽取
文档级关系抽取
数据预处理
数据集
性能评价
-
Keywords
Information extraction
Document-level relation extraction
Data preprocess
Datasets
Performance evaluation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-