-
题名《同义词词林》在中文实体关系抽取中的作用
被引量:26
- 1
-
-
作者
刘丹丹
彭成
钱龙华
周国栋
-
机构
苏州大学自然语言处理实验室
苏州大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第2期91-99,共9页
-
基金
国家自然科学基金(60873150
90920004)
+1 种基金
江苏省自然科学基金(BK2010219
11KJA520003)
-
文摘
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。
-
关键词
中文实体关系抽取
树核函数
同义词词林
语义信息
-
Keywords
Chinese entity relation extraction
tree kernel
TongYiCi CiLin
semantic information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名词汇语义信息对中文实体关系抽取影响的比较
被引量:11
- 2
-
-
作者
刘丹丹
彭成
钱龙华
周国栋
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2012年第8期2238-2244,共7页
-
基金
国家自然科学基金资助项目(60873150
90920004)
+1 种基金
江苏省自然科学基金资助项目(BK2010219
11KJA520003)
-
文摘
提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。
-
关键词
中文实体关系抽取
树核
《同义词词林》
《知网》
语义信息
-
Keywords
Chinese entity relation extraction
tree kernel
TongYiCi CiLin
HowNet
semantic-information
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于核方法的中文实体关系抽取研究
被引量:18
- 3
-
-
作者
黄瑞红
孙乐
冯元勇
黄云平
-
机构
中国科学院软件研究所
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期102-108,共7页
-
基金
国家自然科学基金资助项目(6077302760736044)
国家863计划重点资助项目(2006AA010108)
-
文摘
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。
-
关键词
计算机应用
中文信息处理
中文实体关系抽取
核方法
卷积树核
复合核
最短路径依赖核
-
Keywords
computer application
Chinese information processing
Chinese relation extraction
Kernel-based methods
convolution tree kernel
composite kernels
shortest path dependency kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于依存分析的开放式中文实体关系抽取方法
被引量:27
- 4
-
-
作者
李明耀
杨静
-
机构
上海市多维度信息处理重点实验室
华东师范大学计算机科学技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第6期201-207,共7页
-
基金
上海市科委基金资助项目(14511107000)
-
文摘
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提出一种开放式中文实体关系抽取方法。对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述。根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组。在Sogou CA和Sogou CS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性。与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%。
-
关键词
开放式信息抽取
中文实体关系抽取
依存分析
无监督
启发式规则
-
Keywords
Open Information Extraction(OIE)
Chinese entity relation extraction
dependency parsing
unsupervised
heuristic rule
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名中文实体关系抽取研究综述
被引量:17
- 5
-
-
作者
武文雅
陈钰枫
徐金安
张玉洁
-
机构
北京交通大学计算机与信息技术学院
-
出处
《计算机与现代化》
2018年第8期21-27,34,共8页
-
基金
国家自然科学基金资助项目(61473294
61370130)
+1 种基金
北京市自然科学基金资助项目(4172047)
中央高校基本科研业务费专项资金资助项目(2015JBM033)
-
文摘
作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为必要。本文从实体关系抽取的产生和发展开始,对目前基于中文的实体关系抽取技术现状作了阐述;按照关系抽取方法对语料的依赖程度分为4类:有监督的实体关系抽取、无监督的实体关系抽取、半监督的实体关系抽取和开放域的实体关系抽取,并对这4类抽取方法进行具体的分析和比较;最后介绍深度学习在中文实体关系抽取上的应用成果和发展前景。
-
关键词
中文实体关系抽取
有监督方法
无监督方法
半监督方法
开放域实体关系抽取方法
深度学习
-
Keywords
Chinese entity relation extraction
supervised method
unsupervised method
semi-supervised method
open domain entity relation extraction method
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于实体词语义相似度的中文实体关系抽取
被引量:4
- 6
-
-
作者
徐庆
段利国
李爱萍
阴桂梅
-
机构
太原理工大学计算机科学与技术学院
武汉大学软件工程国家重点实验室
太原师范学院计算机科学与技术系
-
出处
《山东大学学报(工学版)》
CAS
北大核心
2015年第6期7-15,共9页
-
基金
武汉大学软件工程国家重点实验室开放课题资助项目(SKLSE2012-09-30)
山西省自然科学基金资助项目(2013011015-2)
山西省基础条件平台资助项目(2014091004-0104)
-
文摘
为了探索语义相似度在中文实体关系抽取上的作用,提出由实体词在《同义词词林》中的5层编码构建成的《同义词词林》编码树和由关系实例中的实体词,各个类别中所有实体词计算相似度后求得的平均值构建成的实体词语义相似度树2种新特征,并连同已有的《同义词词林》编码、实体类型信息共4种特征探究其对抽取性能的影响。单一特征的试验中,实体类型特征效果最好,F值达到了小类84.9、大类83.2;组合特征的试验中,实体类型和《同义词词林》编码树的组合特征效果最好,大类小类的F值都比实体类型特征提高了2.5,3种组合特征性能不升反降。试验结果表明《同义词词林》编码树是对实体类型的有效补充,但过多的特征会造成信息冗余,使抽取性能下降。
-
关键词
中文实体关系抽取
《同义词词林》
语义相似度
树核函数
语法树
-
Keywords
Chinese entity relation extraction
TongYiCiCi Lin
semantic similarity
tree kernel
syntax tree
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-