摘要
远监督关系抽取算法能够自动将关系库中的关系与无标注的文本对齐,以进行文本中的关系抽取。目前提出的远监督关系抽取算法中,大多数是基于特征的。然而,此类算法在将实例转换为特征时,经常会出现关键信息不突出、数据集线性不可分等问题,影响关系抽取的效果。该文提出了一种基于模式的远监督关系抽取算法,其中引入了基于模式的向量,并使用了基于核的机器学习算法来克服上述问题。实验结果表明,该文提出的基于模式的远监督关系抽取算法,能够有效地提升远监督关系抽取的准确率。
Distant supervision for relation extraction is an approach that can extract relations from texts automatically by aligning a database of facts with texts.Most of existing solutions are feature-based algorithms with certain defects.In this paper,we propose a pattern-based algorithm for distant supervised relation extraction with patternbased vector.A kernel-based method is used in the algorithm to overcome the problems in feature-based algorithm.The experimental result shows that our algorithm can successfully improve the precision of distant supervision for relation extraction.
出处
《中文信息学报》
CSCD
北大核心
2017年第4期122-131,共10页
Journal of Chinese Information Processing
基金
国家自然科学基金(61402532)
关键词
远监督
关系抽取
模式
核方法
distant supervision
relation extraction
pattern
kernel method