期刊文献+

一种融合语义角色和依存句法的实体关系抽取算法 被引量:4

An entity relation extraction algorithm based on semantic roles labeling and dependency parsing
下载PDF
导出
摘要 针对目前基于语义角色的实体及关系抽取技术效果不理想以及存在无法正确提取多个宾语的缺陷,提出一种基于语义角色和依存关系融合的方法:1)通过语义角色标注的方式抽取主语和核心谓词;2)以核心谓词为切入点,通过依存句法关系分析句子的并列结构(COO)和动宾结构(VOB),抽取其中的宾语实体;3)整合主语、核心谓词和宾语构成[实体关系实体]三元组。对该算法和单纯依赖语义角色识别的算法进行了对比实验,结果显示该算法的精确率、召回率、F1值3个指标更优,表明这种实体关系抽取的方法可行有效,且在抽取多宾语的任务中效果明显。 The entity and relationship extraction technology based on semantic roles labeling is not effecctive enough to correctly extract multiple objects. This paper proposes a method based on semantic roles labeling and dependency parsing: 1) Extracting subjects and core predicates through semantic roles labeling;2) Taking the core predicate as the entry point, analyzing the COO structure and VOB structure of the sentence through the dependence sentence relationship, and extracting the object entity among them;3) Integrating subject, core predicate and object to form [ Entity Relation Entity] triple entities. The algorithms based on text and semantic role labeling are compared, and the results show that the text algorithm has better accuracy, recall rate and F1 value, which shows that this method is feasible and effective, and the effect is obvious in the task of extracting multiple objects.
作者 秦晓慧 侯霞 赵雪 QIN Xiaohui;HOU Xia;ZHAO Xue(Computer School,Beijing Information Science&Technology University,Beijing 100101,China)
出处 《北京信息科技大学学报(自然科学版)》 2019年第1期64-67,98,共5页 Journal of Beijing Information Science and Technology University
基金 国家自然科学基金项目(61672105) 国家重点研发计划项目(2018YFB004100) 国家文物局"互联网+中华文明"示范项目(2018203) 北京信息科技大学促进高校内涵发展-信息+项目-面向大数据的竞争情报分析关键技术研究
关键词 实体抽取 知识图谱 语义角色标注 依存句法分析 entity extraction knowledge graph semantic roles labeling dependency parsing
  • 相关文献

参考文献10

二级参考文献117

共引文献1298

同被引文献54

引证文献4

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部