-
题名远程监督关系抽取综述
被引量:21
- 1
-
-
作者
杨穗珠
刘艳霞
张凯文
洪吟
黄翰
-
机构
华南理工大学软件工程
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2021年第8期1636-1660,共25页
-
基金
国家自然科学基金(61876208)
广东省重点研发项目(2018B010109003)
广州市科技计划(201802010007,201804010276)资助
-
文摘
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研究方向为关系模型的降噪手段以及对长尾关系的处理方法。近年来,随着深度学习技术的发展,这两个领域的研究工作也迎来了新一轮的机遇与挑战。本文对近几年远程监督关系抽取的研究进展进行综述,针对基于深度学习的远程监督关系抽取任务定义常用工作流,其中包括样本降噪、外部信息融合、编码器和分类器。本文根据不同的模块将已有的研究成果进行分类和梳理,分析比较主要方法,整理其中的关键问题,介绍已有的解决方案和相关数据集,总结远程监督关系抽取任务所用评测指标与评估方式,展望未来研究趋势。
-
关键词
关系抽取
信息抽取
远程监督
降噪
长尾现象
错误标注
-
Keywords
relation extraction
information extraction
distant supervision
noise reduction
long tail
wrong labelling
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-