期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于依存分析的开放式中文实体关系抽取方法 被引量:27
1
作者 李明耀 杨静 《计算机工程》 CAS CSCD 北大核心 2016年第6期201-207,共7页
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提... 实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系。由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清。为此,利用依存分析,提出一种开放式中文实体关系抽取方法。对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述。根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组。在Sogou CA和Sogou CS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性。与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%。 展开更多
关键词 开放式信息抽取 中文实体关系抽取 依存分析 无监督 启发式规则
下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
2
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 SHAP方法
下载PDF
无指导的中文开放式实体关系抽取 被引量:48
3
作者 秦兵 刘安安 刘挺 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1029-1035,共7页
传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关... 传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关系类型体系是很困难的.开放式实体关系抽取技术解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少.提出面向大规模网络文本的无指导开放式中文实体关系抽取方法,首先使用实体之间的距离限制和关系指示词的位置限制获取候选关系三元组;然后采用全局排序和类型排序的方法来挖掘关系指示词;最后使用关系指示词和句式规则对关系三元组进行过滤.在获取大量关系三元组的同时,还保证了80%以上的微观平均准确率. 展开更多
关键词 开放式实体关系抽取 无指导 关系三元组 关系指示词 信息抽取
下载PDF
中文开放式多元实体关系抽取 被引量:13
4
作者 李颖 郝晓燕 王勇 《计算机科学》 CSCD 北大核心 2017年第S1期80-83,共4页
传统信息抽取针对特定的领域。当转换到新领域时,需要人工编写新的抽取规则和人工标记新的训练样本。开放信息抽取突破了传统信息抽取的局限性。现有的开放式信息抽取系统大多针对英文,然而,目前对于中文的研究相对较少,并主要以抽取三... 传统信息抽取针对特定的领域。当转换到新领域时,需要人工编写新的抽取规则和人工标记新的训练样本。开放信息抽取突破了传统信息抽取的局限性。现有的开放式信息抽取系统大多针对英文,然而,目前对于中文的研究相对较少,并主要以抽取三元组为主,没有针对中文抽取多元组的方法。因此提出了一种基于依存分析的中文开放式多元实体关系抽取方法。首先,对文本集进行预处理和依存关系分析;然后将动词视为候选关系词,将与此动词有满足条件的有效依存路径的基本名词短语视为实体词,关联两个及两个以上的实体词的关系词可与实体词组成候选多元实体关系组;最后,使用经过训练的逻辑回归分类器对多元实体关系组进行过滤。对百度百科数据集的抽取结果显示,所提方法在抽取大量实体关系多元组时准确性可达到81%。 展开更多
关键词 中文开放式信息抽取 依存分析 实体关系抽取 机器学习 OIE word2vec
下载PDF
基于关系指示词库的开放式实体关系抽取算法 被引量:1
5
作者 王月 周刚 +2 位作者 南煜 郑梓圣 田菲 《信息工程大学学报》 2017年第2期242-247,252,共7页
为解决传统实体关系抽取方法适应性较差的问题,提出基于关系指示词库的开放式实体关系抽取方法(WCORE)。根据上下文环境自动构建与人工补充的方式构建关系指示词库,两种方式相互补充,主要论述3个问题:关系三元组的确立;关系指示词信息... 为解决传统实体关系抽取方法适应性较差的问题,提出基于关系指示词库的开放式实体关系抽取方法(WCORE)。根据上下文环境自动构建与人工补充的方式构建关系指示词库,两种方式相互补充,主要论述3个问题:关系三元组的确立;关系指示词信息增益的计算与关系指示词库的构建;基于关系指示词库的分类实体关系信息抽取。以真实微博文本作为语料,平均F值达到了75.90%,实验结果表明该方法具有较好的可行性和适应性。 展开更多
关键词 关系三元组 开放式实体关系抽取 关系指示词 指导库 语义相似度
下载PDF
基于深度学习的实体关系联合抽取研究综述 被引量:7
6
作者 张仰森 刘帅康 +2 位作者 刘洋 任乐 辛永辉 《电子学报》 EI CAS CSCD 北大核心 2023年第4期1093-1116,共24页
实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构... 实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构化文本语句中识别实体边界和类型.然后,将该命名实体识别器识别的实体与类型作为关系抽取任务中所用数据的标注.最后,通过关系抽取器得到两个实体之间的关系类别,进而组合成为结构化的实体关系三元组.命名实体识别任务存在的误差会影响后续的关系抽取任务的性能,这使得流水线方法具有错误累积问题.这是因为关系抽取任务中使用的标注数据来自于前面的命名实体识别任务,这会有一定的误差,进而影响关系抽取的结果质量.此外,流水线方法减弱了两个子任务之间的特征关联,这会出现冗余实体的问题.命名实体识别任务和关系抽取任务独立进行学习训练,导致这两个子任务间缺乏交互,使得文本信息没有得到充分利用,限制了流水线方法的性能瓶颈.由于非结构化文本信息没有得到充分利用,流水线方法在抽取实体间长依赖关系时具有一定局限性,很难达到联合抽取模型的性能指标.实际应用中,实体间往往存在多种关系,流水线方法无法充分使用全局文本信息,且命名实体识别会产生冗余实体,在抽取多元重叠关系时,该方法具有一定的局限性.因此,在构建高准确率实体关系抽取模型时,流水线方法具有欠缺之处.本文对实体关系联合抽取的研究发展全景进行了综述,简要阐明整数线性规划、卡片金字塔解析模型、概率图模型和结构化预测模型这四类基于特征工程的联合模型的共同缺点.本文聚焦基于深度学习的实体关系联合抽取技术,根据近年来实体关系联合抽取前沿研究成果,总结了实体关系联合抽取模型的主流构建方法.按照建模思想的特点总结为三种建模方法:多模块-多步骤、多模块-单步骤以及单模块-单步骤.多模块-多步骤建模方法主要包含实体域映射关系域、关系域映射实体域和头实体域映射关系-尾实体域这三种类别.这三类模型的共同特点都是将三元组的提取过程分为多个模块,通过共享参数的方式整合各个模块,逐步迭代得到三元组.这种方法推动联合模型性能提升,初步解决了流水线方法存在的问题.但每个步骤使用独立的解码算法,导致解码误差累积问题.且共享参数整合各个模块的冗余误差会互相影响预测性能,从而产生级联冗余问题.多模块-单步骤建模方法旨在构建一个最优化的联合解码算法,并对其求取最优解进而得到最优超参数.这种方法设计了简单精确的联合解码算法,并加强了多个子模块间的交互性,减弱了因为逐步迭代导致的解码误差和级联冗余对联合模型性能的影响.然而,模块的分离依然会产生冗余错误,具有一定局限性.单模块-单步骤建模方法可以直接从文本语句中抽取三元组,有效缓解了多模块-多步骤和多模块-单步骤建模方法的级联错误和实体冗余等问题.本文以前沿文献中具有代表性的联合模型为例,详细分析了这些模型的建模思路,剖析了各个模型的优缺点,将多个具有共同建模思路的经典模型进行归类,以阐述实体关系联合抽取模型的发展趋势.本文将单模块-单步骤建模方法的代表模型在公开基准数据集上的模型性能与多模块-多步骤和多模块-单步骤的代表模型性能进行对比分析,阐明实体关系联合抽取模型的建模思路正在从基于多模块-多步骤和多模块-单步骤的复杂建模方法,逐渐向单模块-单步骤的高效建模方法转变的客观趋势.最后,本文对三个实体关系联合抽取的研究方向进行了展望.当下主流的联合模型聚焦于限定域的实体关系抽取任务,对于开放域问题研究得不够.开放域实体关系联合抽取任务是未来的研究人员亟待解决的问题之一.在实际工业应用中,文本语料包含多元信息,如时序信息.而当前的实体关系联合抽取模型大多依据单一文本上下文信息进行特征抽取,从而忽略了时序信息.若融入像时序信息这样的多元信息或能进一步提升联合模型性能,这是未来一项具有重大意义的课题.此外,对于跨文本的实体关系联合抽取模型研究较少,这也是该领域未来的一个研究趋势.本文旨在建立一个完整的基于深度学习的实体关系联合抽取领域研究视图,以对相关领域研究者有所帮助. 展开更多
关键词 信息抽取 知识图谱 深度学习 实体关系联合抽取 流水线方法
下载PDF
面向中文专利的开放式实体关系抽取研究 被引量:3
7
作者 赵奇猛 王裴岩 +1 位作者 冯好国 蔡东风 《计算机工程与应用》 CSCD 北大核心 2015年第1期125-129,171,共6页
针对传统实体关系抽取需要预先指定关系类型和制定抽取规则等无法胜任大规模文本的情况,开放式信息抽取(Open Information Extraction,OIE)在以英语为代表的西方语言中取得了重大进展,但对于汉语的研究却显得不足。为此,研究了在组块层... 针对传统实体关系抽取需要预先指定关系类型和制定抽取规则等无法胜任大规模文本的情况,开放式信息抽取(Open Information Extraction,OIE)在以英语为代表的西方语言中取得了重大进展,但对于汉语的研究却显得不足。为此,研究了在组块层次标注基础上应用马尔可夫逻辑网分层次进行中文专利开放式实体关系抽取的方法。实验表明:以组块为出发点降低了对句子理解的难度,外层和内层组块可以统一处理,减少了工程代价;而且在相同特征条件下与支持向量机相比,基于马尔可夫逻辑网的关系抽取效果更理想,外层和内层识别结果的F值分别可达到77.92%和69.20%。 展开更多
关键词 中文专利依存树库 开放式实体关系抽取 MARKOV逻辑网
下载PDF
实体关系抽取的技术方法综述 被引量:54
8
作者 徐健 张智雄 吴振新 《现代图书情报技术》 CSSCI 北大核心 2008年第8期18-23,共6页
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构... 对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。 展开更多
关键词 实体关系抽取 信息抽取 关系抽取方法
下载PDF
基于核方法的中文实体关系抽取研究 被引量:18
9
作者 黄瑞红 孙乐 +1 位作者 冯元勇 黄云平 《中文信息学报》 CSCD 北大核心 2008年第5期102-108,共7页
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改... 命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。 展开更多
关键词 计算机应用 中文信息处理 中文实体关系抽取 方法 卷积树核 复合核 最短路径依赖核
下载PDF
实体关系抽取综述
10
作者 乔文捷 《长江信息通信》 2023年第4期99-101,共3页
作为信息抽取的核心任务,关系抽取能够从大量的无规则信息中抽取关系三元组,为知识图谱、问答系统等提供知识来源。首先简要介绍关系抽取的发展历程,重点阐述主流的关系抽取方法及模型,并对各种关系抽取技术进行分析。最后,对关系抽取... 作为信息抽取的核心任务,关系抽取能够从大量的无规则信息中抽取关系三元组,为知识图谱、问答系统等提供知识来源。首先简要介绍关系抽取的发展历程,重点阐述主流的关系抽取方法及模型,并对各种关系抽取技术进行分析。最后,对关系抽取的未来发展领域和方向进行了总结和展望。 展开更多
关键词 实体关系抽取 有监督方法 机器学习 深度学习
下载PDF
实体关系抽取研究综述 被引量:18
11
作者 刘绍毓 李弼程 +2 位作者 郭志刚 王波 陈刚 《信息工程大学学报》 2016年第5期541-547,共7页
实体关系抽取作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别,对句子语义理解及实体语义知识库构建有着重要作用。回顾了实体关系抽取的发展史,总结了有监督实体关系抽取、无监督实体关系抽取、半监督实体关系抽取... 实体关系抽取作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别,对句子语义理解及实体语义知识库构建有着重要作用。回顾了实体关系抽取的发展史,总结了有监督实体关系抽取、无监督实体关系抽取、半监督实体关系抽取和开放式实体关系抽取4类方法的原理和代表性研究,并对各类方法进行了详细比较。 展开更多
关键词 实体关系抽取 有监督方法 无监督方法 半监督方法 开放式实体关系抽取方法
下载PDF
基于自举的弱指导中文实体关系抽取研究
12
作者 李小红 钱龙华 《高科技与产业化》 2010年第9期109-110,108,共3页
本文提出了一种基于自举学习的弱指导中文实体关系抽取方法。给定一个小规模的已标注数据集(初始种子集)和一个大规模的未标注数据集,利用从种子集中训练出来的分类器在未标注数据集上产生可靠的实例,再加入到标注数据集中,从而不断扩... 本文提出了一种基于自举学习的弱指导中文实体关系抽取方法。给定一个小规模的已标注数据集(初始种子集)和一个大规模的未标注数据集,利用从种子集中训练出来的分类器在未标注数据集上产生可靠的实例,再加入到标注数据集中,从而不断扩展标注数据集。在ACE RDC 2005中文基准语料库上的弱指导关系抽取实验表明,该方法能提高抽取性能。 展开更多
关键词 实体关系抽取 中文 自举 数据集中 抽取方法 标注 小规模 分类器
下载PDF
中文实体关系抽取研究综述 被引量:17
13
作者 武文雅 陈钰枫 +1 位作者 徐金安 张玉洁 《计算机与现代化》 2018年第8期21-27,34,共8页
作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为... 作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为必要。本文从实体关系抽取的产生和发展开始,对目前基于中文的实体关系抽取技术现状作了阐述;按照关系抽取方法对语料的依赖程度分为4类:有监督的实体关系抽取、无监督的实体关系抽取、半监督的实体关系抽取和开放域的实体关系抽取,并对这4类抽取方法进行具体的分析和比较;最后介绍深度学习在中文实体关系抽取上的应用成果和发展前景。 展开更多
关键词 中文实体关系抽取 有监督方法 无监督方法 半监督方法 开放实体关系抽取方法 深度学习
下载PDF
实体关系抽取技术研究进展综述 被引量:25
14
作者 刘辉 江千军 +4 位作者 桂前进 张祺 王梓豫 王磊 王京景 《计算机应用研究》 CSCD 北大核心 2020年第S02期1-5,共5页
实体关系抽取是指从句子中抽取两个实体之间的关系类别的任务。作为自然语言处理的关键性技术,实体关系抽取在信息检索、知识图谱、自动问答系统等领域具有广阔的应用前景。对于实体关系抽取研究历程作出了详细评述,包括从传统的实体关... 实体关系抽取是指从句子中抽取两个实体之间的关系类别的任务。作为自然语言处理的关键性技术,实体关系抽取在信息检索、知识图谱、自动问答系统等领域具有广阔的应用前景。对于实体关系抽取研究历程作出了详细评述,包括从传统的实体关系抽取到目前基于深度学习的实体关系抽取。重点阐述了基于深度学习的实体关系抽取的主要模型以及流程框架,并对实体关系抽取存在的技术难点加以总结,最后对实体关系抽取的发展进行展望。 展开更多
关键词 实体关系抽取 有监督方法 无监督方法 开放领域实体关系抽取 深度学习
下载PDF
基于网络挖掘的实体关系元组自动获取 被引量:7
15
作者 李维刚 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2007年第11期2111-2116,共6页
二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组... 二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取出的元组进一步处理,能够获取更多有价值的信息. 展开更多
关键词 自举方法 实体关系 元组 信息抽取 网络挖掘
下载PDF
受限域汉语问答系统普适性理论与方法研究
16
《中国科技奖励》 2016年第7期60-60,共1页
主要完成人:余正涛、郭剑毅、毛存礼、线岩团、邹俊杰、吴则建、张宜浩 主要完成单位:昆明理工大学 该项目主要技术内容及发现点:1.提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法和基于最大熵的领域实体关系的抽取... 主要完成人:余正涛、郭剑毅、毛存礼、线岩团、邹俊杰、吴则建、张宜浩 主要完成单位:昆明理工大学 该项目主要技术内容及发现点:1.提出了融合长距离依赖特征的Markov逻辑网中文命名实体识别方法和基于最大熵的领域实体关系的抽取方法,自动获取领域的实体及实体关系,为实现从非结构化领域文本中获取与组织领域知识提供理论与技术保障。 展开更多
关键词 汉语问答系统 普适性 MARKOV逻辑网 昆明理工大学 实体关系 抽取方法 识别方法 命名实体
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部