-
题名基于关系指示词库的开放式实体关系抽取算法
被引量:1
- 1
-
-
作者
王月
周刚
南煜
郑梓圣
田菲
-
机构
信息工程大学
数学工程与先进计算国家重点实验室
-
出处
《信息工程大学学报》
2017年第2期242-247,252,共7页
-
文摘
为解决传统实体关系抽取方法适应性较差的问题,提出基于关系指示词库的开放式实体关系抽取方法(WCORE)。根据上下文环境自动构建与人工补充的方式构建关系指示词库,两种方式相互补充,主要论述3个问题:关系三元组的确立;关系指示词信息增益的计算与关系指示词库的构建;基于关系指示词库的分类实体关系信息抽取。以真实微博文本作为语料,平均F值达到了75.90%,实验结果表明该方法具有较好的可行性和适应性。
-
关键词
关系三元组
开放式实体关系抽取
关系指示词
指导库
语义相似度
-
Keywords
relational triple
open entity relation extraction
relation word
library
semantic similarity
-
分类号
TN929.5
[电子电信—通信与信息系统]
-
-
题名无指导的中文开放式实体关系抽取
被引量:48
- 2
-
-
作者
秦兵
刘安安
刘挺
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第5期1029-1035,共7页
-
基金
国家自然科学基金项目(61122012
61273321)
国家"八六三"高技术研究发展计划基金项目(2012AA011102)
-
文摘
传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关系抽取方法,首先使用实体之间的距离限制和关系指示词的位置限制获取候选关系三元组;然后采用全局排序和类型排序的方法来挖掘关系指示词;最后使用关系指示词和句式规则对关系三元组进行过滤.在获取大量关系三元组的同时,还保证了80%以上的微观平均准确率.
-
关键词
开放式实体关系抽取
无指导
关系三元组
关系指示词
信息抽取
-
Keywords
open entity relation extraction
unsupervised
relation triple
relation word
information extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向领域概念的语义关系抽取方法
被引量:4
- 3
-
-
作者
王舒琪
冯晓
张树武
关虎
-
机构
中国传媒大学信息工程学院
中国科学院自动化研究所数字内容中心
-
出处
《中国传媒大学学报(自然科学版)》
2017年第3期34-40,共7页
-
基金
国家科技支撑计划课题"数字出版资源集成投送系统研发"(课题编号:2015BAH49F01)
-
文摘
提出了一个针对领域概念的开放式语义关系抽取方法,不需要预先定义关系类型,对句子进行依存句法分析,抽取最短依存路径,并通过添加启发式规则获取描述领域概念对的关系指示词。实验结果表明,所提出的方法是可行和有效的,能获得特定领域中存在的丰富的语义关系。
-
关键词
领域概念
语义关系
依存句法分析
最短依存路径
关系指示词
-
Keywords
domain concepts
open semantic relation
dependency parsing(DP)
the shortest dependency path(TSDP)
relation words
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于句法语义特征的实体关系抽取技术
被引量:3
- 4
-
-
作者
姚春华
刘潇
高弘毅
鄢秋霞
-
机构
中国电子科技集团公司第三十研究所
解放军驻西安邮电大学选培办
中国电子科技网络信息安全有限公司
-
出处
《通信技术》
2018年第8期1828-1835,共8页
-
基金
国家重点研发计划(No.2017YFC0820700)~~
-
文摘
实体关系抽取将非结构化的数据转化为结构化的数据,是自然语言处理任务的重要基础。针对人与人之间的六种关系——父母、子女、夫妻、兄弟姐妹、同事、其他,在人与人之间六种关系语料库缺少的情况,采用百度百科的语料库构建五个类别(父母、子女、夫妻、兄弟姐妹、同事)的关系指示词词典,再根据关系指示词词典来判定实体对关系类型。采用上述方法,结合人工标定扩充五个类别(父母、子女、夫妻、兄弟姐妹、同事)语料库,根据中文的语法特点设计了一系列的特征,包括实体本身的词、词性标注以及实体上下文环境的词、词性特征。另外,融入实体的依存句法关系值、实体与核心谓词距离的特征,并构建二元实体对特征向量,采用logistic进行训练和测试。针对文本中含有多对二元实体对,通过统计文本中关系指示词的个数,使得句子中二元实体对不超过关系指示词的个数。实验结果证明,在人与人的关系识别中,准确率和召回率都可以达到87%。
-
关键词
关系指示词词典
实体关系抽取
语义特征
句法依存关系值
LOGISTIC
-
Keywords
relation indicator dictionary
entity relation extraction
semantic feature
syntax dependency value
logistic
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-