期刊文献+
共找到227篇文章
< 1 2 12 >
每页显示 20 50 100
基于BERT古文预训练模型的实体关系联合抽取
1
作者 李智杰 杨盛杰 +3 位作者 李昌华 张颉 董玮 介军 《计算机系统应用》 2024年第8期187-195,共9页
古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模... 古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模型(entity relation joint extraction model based on BERT-ancient-Chinese pretrained model,JEBAC).首先,通过融合BiLSTM神经网络和注意力机制的BERT古文预训练模型(BERT-ancientChinese pre-trained model integrated BiLSTM neural network and attention mechanism,BACBA),识别出句中所有的subject实体和object实体,为关系和object实体联合抽取提供依据.接下来,将subject实体的归一化编码向量与整个句子的嵌入向量相加,以更好地理解句中subject实体的语义特征;最后,结合带有subject实体特征的句子向量和object实体的提示信息,通过BACBA实现句中关系和object实体的联合抽取,从而得到句中所有的三元组信息(subject实体,关系,object实体).在中文实体关系抽取DuIE2.0数据集和CCKS 2021的文言文实体关系抽取CCLUE小样本数据集上,与现有的方法进行了性能比较.实验结果表明,该方法在抽取性能上更加有效,F1值分别可达79.2%和55.5%. 展开更多
关键词 古汉语文本 实体关系抽取 BerT古文预训练模型 BiLSTM 注意力 三元组信息
下载PDF
基于实体级联类型的中文关系抽取管道模型
2
作者 饶东宁 吴倩梅 黄观琚 《计算机应用研究》 CSCD 北大核心 2024年第9期2685-2689,共5页
端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时... 端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时具有多个类型,这种多义性的情况在中文数据集中尤为常见。为解决上述问题,提出了一种实体级联类型机制,并在此基础上开发了一个更适合中文关系抽取的管道模型,取名为CENTRELINE。该流水线方法的实体模块是一个词-词关系分类模型,它以BERT和双向LSTM作为编码器、经过条件层归一化后引入空洞卷积,最后通过级联类型预测器输出实体及其级联类型。关系模块的输入仅由实体模块构建。该方法在DuIE1.0、DuIE2.0和CMeIE-V2数据集上的F_(1)值分别比基线方法提高了7.23、6.93和8.51百分点,并在DuIE1.0和DuIE2.0数据集上都实现了最先进的性能。消融实验表明,提出的级联类型机制和根据中文语言特征改进的管道模型,均对关系抽取性能具有明显的促进作用。 展开更多
关键词 中文关系抽取 管道模型 空洞卷积 实体级联类型
下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型
3
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBerTa预训练模型 全局指针网络
下载PDF
基于实体-联系模型的中医药标准关系模型构建研究
4
作者 何心如 李静 桑珍 《中国中医药信息杂志》 CAS CSCD 2024年第4期20-25,共6页
体量日趋庞大的中医药标准为制修订工作和综合管理带来严峻挑战,利用数字技术为标准赋能具有重要战略意义。本研究通过对中医药标准名称信息的深度挖掘和解读,提出基于实体-联系模型的标准间关系建模方法,构建包含7种关系模式的关系模型... 体量日趋庞大的中医药标准为制修订工作和综合管理带来严峻挑战,利用数字技术为标准赋能具有重要战略意义。本研究通过对中医药标准名称信息的深度挖掘和解读,提出基于实体-联系模型的标准间关系建模方法,构建包含7种关系模式的关系模型,并以标准检索为例展示模型的应用场景,为机器读取和使用标准、提高中医药标准检索效率、掌握目标标准相关资源、推动中医药标准数字化转型提供支撑。 展开更多
关键词 实体-联系模型 关系模型 中医药标准 标准名称 数字化转型
下载PDF
双关系预测与特征融合的实体关系抽取模型
5
作者 沈健 夏鸿斌 刘渊 《智能系统学报》 CSCD 北大核心 2024年第2期462-471,共10页
现有分阶段解码的实体关系抽取模型仍存在着阶段间特征融合不充分的问题,会增大曝光偏差对抽取性能的影响。为此,提出一种双关系预测和特征融合的实体关系抽取模型(entity relation extraction model with dual relation prediction and... 现有分阶段解码的实体关系抽取模型仍存在着阶段间特征融合不充分的问题,会增大曝光偏差对抽取性能的影响。为此,提出一种双关系预测和特征融合的实体关系抽取模型(entity relation extraction model with dual relation prediction and feature fusion,DRPFF),该模型使用预训练的基于Transformer的双向编码表示模型(bidirectional encoder representation from transformers,BERT)对文本进行编码,并设计两阶段的双关系预测结构来减少抽取过程中错误三元组的生成。在阶段间通过门控线性单元(gated linear unit,GLU)和条件层规范化(conditional layer normalization,CLN)组合的结构来更好地融合实体之间的特征。在NYT和WebNLG这2个公开数据集上的试验结果表明,该模型相较于基线方法取得了更好的效果。 展开更多
关键词 实体关系抽取 关系三元组 预训练模型 关系预测 指针网络 特征融合 门控线性单元 条件层规范化
下载PDF
利用Bert模型实现电力安全规程数据中实体关系抽取
6
作者 徐鸿飞 李英娜 《电力科学与工程》 2023年第1期44-51,共8页
引入句袋注意力机制,对电力安全规程领域数据集进行预处理,以减小数据集中噪声对实验的影响。使用Bert模型对文本进行词嵌入处理;使用Bi LSTM和CRF算法抽取实体之间的关系。在自有电力安全规程数据集上测试,测试F1值达到91.5%,该结果说... 引入句袋注意力机制,对电力安全规程领域数据集进行预处理,以减小数据集中噪声对实验的影响。使用Bert模型对文本进行词嵌入处理;使用Bi LSTM和CRF算法抽取实体之间的关系。在自有电力安全规程数据集上测试,测试F1值达到91.5%,该结果说明模型有效。 展开更多
关键词 电力系统运行 安全规程数据 深度学习 实体关系抽取 句袋注意力机制 Bert模型
下载PDF
因果关系表示增强的跨领域命名实体识别
7
作者 刘小明 曹梦远 +2 位作者 杨关 刘杰 王杭 《计算机工程与应用》 CSCD 北大核心 2024年第18期176-188,共13页
跨领域命名实体识别在现实应用中,尤其在目标领域数据稀缺的小样本场景中具有重要价值。然而,现有方法主要是通过特征表示或模型参数共享实现的跨领域实体能力迁移,未充分考虑由于样本选择偏差而引起的虚假相关性问题。为了解决跨领域... 跨领域命名实体识别在现实应用中,尤其在目标领域数据稀缺的小样本场景中具有重要价值。然而,现有方法主要是通过特征表示或模型参数共享实现的跨领域实体能力迁移,未充分考虑由于样本选择偏差而引起的虚假相关性问题。为了解决跨领域中的虚假相关性问题,提出一种因果关系表示增强的跨领域命名实体识别模型,将源域的语义特征表示与目标域的语义特征表示进行融合,生成一种增强的上下文语义特征表示。通过结构因果模型捕捉增强后的特征变量与标签之间的因果关系。在目标域中应用因果干预和反事实推断策略,提取存在的直接因果效应,从而进一步缓解特征与标签之间的虚假相关性问题。该方法在公共数据集上进行了实验,实验结果得到了显著提高。 展开更多
关键词 跨领域命名实体识别 迁移学习 因果关系 结构因果模型 语义特征表示
下载PDF
词嵌入BERT-CRF玉米育种实体关系联合抽取方法 被引量:1
8
作者 李书琴 庞文婷 《农业机械学报》 EI CAS CSCD 北大核心 2023年第11期286-294,共9页
针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉... 针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉米育种语料表达特征,采用对实体边界、关系类别和实体位置信息同步标注的策略;其次,构建了嵌入词汇信息的BERT-CRF模型进行训练和预测,自建玉米育种知识词典,通过在BERT中嵌入词汇信息,融合字符特征和词汇特征,增强模型的语义能力,利用CRF模型输出全局最优标签序列,设计了实体关系三元组匹配算法(Entity and relation triple matching algorithm,ERTM),将标签进行匹配和映射来获取三元组;最后,为验证该方法的有效性,在玉米育种数据集上进行实验,结果表明,本文模型精确率、召回率和F1值分别为91.84%、95.84%、93.80%,与现有模型相比性能均有提升。说明该方法能够有效抽取玉米育种领域知识,为构建玉米育种知识图谱及其它下游任务提供数据基础。 展开更多
关键词 玉米育种 实体关系联合抽取 序列标注 BerT语言模型 词嵌入
下载PDF
一个实体关系与事件抽取的通用模型
9
作者 杨红菊 靳新宇 《计算机工程》 CAS CSCD 北大核心 2023年第2期143-149,共7页
信息提取的目的是从自然语言文件中找到具体信息,现有研究在信息抽取的实体关系和事件抽取任务中仅解决事件论元重叠和实体关系重叠的问题,未考虑两个任务共有的角色重叠问题,导致抽取结果准确率降低。提出一个两阶段的通用模型用于完... 信息提取的目的是从自然语言文件中找到具体信息,现有研究在信息抽取的实体关系和事件抽取任务中仅解决事件论元重叠和实体关系重叠的问题,未考虑两个任务共有的角色重叠问题,导致抽取结果准确率降低。提出一个两阶段的通用模型用于完成实体关系抽取和事件抽取子任务。基于预训练语言模型RoBERTa的共享特征表示,分别对实体关系/事件类型和实体关系/事件论元进行预测。将传统抽取触发词任务转化为多标签抽取事件类型任务,利用多尺度神经网络进一步提取文本特征。在此基础上,通过抽取文本相关类型的事件论元,根据论元角色的重要性对损失函数重新加权,解决数据不平衡、实体关系抽取和事件抽取中共同存在论元角色重叠的问题。在千言数据集中事件抽取和关系抽取任务测试集上的实验验证了该模型的有效性,结果表明,该模型的F1值分别为83.1%和75.3%。 展开更多
关键词 事件抽取 实体关系抽取 角色重叠 RoBerTa模型 多标签分类
下载PDF
ERP系统中对象模型向实体关系模型的映射 被引量:31
10
作者 边世红 蒋平 卢慧琼 《计算机工程与设计》 CSCD 2002年第3期22-25,共4页
在诸如企业资源计划(ERP)大型复杂管理信息软件系统的开发过程中,目前越来越多地采用面向对象的开发方法和构件化的实现技术。由于这类系统目前是基于关系型数据库来实现的,所以要求在面向对象模型(OOM)和实体关系模型(ERM)之... 在诸如企业资源计划(ERP)大型复杂管理信息软件系统的开发过程中,目前越来越多地采用面向对象的开发方法和构件化的实现技术。由于这类系统目前是基于关系型数据库来实现的,所以要求在面向对象模型(OOM)和实体关系模型(ERM)之间具有规范且稳定的映射方法,以便于构件的构造。以提高构件的适应性和重用度为目标,提出了实现OOM向ERM映射的原则、方法,并且给出了在ERP系统设计中OOM向ERM映射的技术方案。该方法和技术方案已经在一个针对不同类型企业的商品化ERP系统的开发中得以有效的应用。 展开更多
关键词 对象数据模型 实体-关系模型 构件 企业资源计划 erP系统
下载PDF
基于对span的预判断和多轮分类的实体关系抽取
11
作者 佟缘 姚念民 《计算机工程与科学》 CSCD 北大核心 2024年第5期916-928,共13页
针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块... 针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块。Smrc模型通过Pej模块的初步判断及Emr模块的多轮实体分类来进行实体识别,再利用Rmr模块的多轮关系分类来判断实体对间的关系,进而完成关系抽取任务。在CoNLL04、SciERC和ADE 3个实验数据集上,Smrc模型的实体识别F1值分别达到89.67%,70.62%和89.56%,关系抽取F1值分别达到73.11%,51.03%和79.89%,相较之前在3个数据集上的最佳模型Spert,Smrc模型凭借实体预判断和实体及关系多轮分类,在2个子任务上其F1值分别提高了0.73%,0.29%,0.61%及1.64%,0.19%,1.05%,表明了该模型的有效性及其优势。 展开更多
关键词 对span的预判断 实体关系抽取 BerT预训练模型 多轮实体分类 多轮关系分类
下载PDF
基于预训练的藏医药实体关系抽取
12
作者 周青 拥措 +1 位作者 拉毛东只 尼玛扎西 《中文信息学报》 CSCD 北大核心 2024年第8期76-83,共8页
藏医药领域的文本主要以非结构化形式保存,藏医药文本的信息抽取对挖掘藏医药的知识有重要作用。针对现有藏文实体关系抽取模型语义表达能力差、嵌套实体抽取准确率低的问题,该文介绍了一种基于预训练模型的实体关系抽取方法,使用Tibeta... 藏医药领域的文本主要以非结构化形式保存,藏医药文本的信息抽取对挖掘藏医药的知识有重要作用。针对现有藏文实体关系抽取模型语义表达能力差、嵌套实体抽取准确率低的问题,该文介绍了一种基于预训练模型的实体关系抽取方法,使用TibetanAI_ALBERT_v2.0预训练语言模型,使得模型更好地识别实体,使用Span方法解决实体嵌套问题。在Dropout的基础上,增加了一个KL散度损失函数项,提升了模型的泛化能力。在TibetanAI_TMIE_v1.0藏医药数据集上进行了实验,实验结果表明,精确率、召回率和F1值分别达到了84.5%、80.1%和82.2%,F1值较基线提升了4.4个百分点,实验结果证明了该文方法的有效性。 展开更多
关键词 藏医药 实体关系抽取 预训练语言模型
下载PDF
矿山知识图谱构建的实体关系抽取方法研究
13
作者 杨森森 李海涛 +1 位作者 杜伟升 薛珊珊 《煤炭技术》 CAS 2024年第11期259-263,共5页
知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准... 知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准确率和F1值,为煤矿智能化提供技术支撑。 展开更多
关键词 矿山 知识图谱 实体关系抽取 ALBerT-BiLSTM-Att-CRF模型
下载PDF
面向对象的实体关系模型(OOER) 被引量:4
14
作者 杜晓明 于永利 《计算机工程与应用》 CSCD 北大核心 1998年第3期23-24,49,共3页
实体关系模型(EntityRelationshipModel简称ER)是软件系统分析时建立概念性数据模型的有效工具,但软件设计的本质在于数据处理、数据信息及其相应处理的分析应是软件设计的主要目的。ER模型能将问题空间... 实体关系模型(EntityRelationshipModel简称ER)是软件系统分析时建立概念性数据模型的有效工具,但软件设计的本质在于数据处理、数据信息及其相应处理的分析应是软件设计的主要目的。ER模型能将问题空间直接映射成信息实体,但还缺少数据处理分析的支持,本文提出的面向对象ER模型(OOER),将原ER模型扩展成信息模型和处理模型两部分,进一步增强了原ER模型数据信息的图形表达能力和数据处理分析能力。 展开更多
关键词 信息模型 面向对象 实体关系模型 数据库系统
下载PDF
融合预训练模型与神经网络的实体关系抽取 被引量:2
15
作者 邓成汝 凌捷 《计算机工程与设计》 北大核心 2023年第7期2023-2029,共7页
为进一步提高实体关系抽取的效果,对传统标注方案进行改进,构建一个融合预训练模型和神经网络的联合抽取模型。利用RoBERTa(robustly optimized BERT approach)和Bi-LSTM(bi-directional long short-term memory)对文本进行编码,对上下... 为进一步提高实体关系抽取的效果,对传统标注方案进行改进,构建一个融合预训练模型和神经网络的联合抽取模型。利用RoBERTa(robustly optimized BERT approach)和Bi-LSTM(bi-directional long short-term memory)对文本进行编码,对上下文信息进行建模后,通过CRF(conditional random fields)识别实体,利用LSTM(long short term memory)进行关系分类。在中文数据集DuIE上进行消融实验和对比实验,此模型的F1指标达到77.1%,精确率高达78.3%,两项指标比当前主流模型FETI分别提高了1.3%和2.6%,实验结果验证了该模型的优势。 展开更多
关键词 实体识别 关系抽取 预训练模型 Bi-LSTM技术 CRF技术 神经网络 联合抽取
下载PDF
自注意力机制下复杂文本实体关系抽取方法
16
作者 针钰 马晓宁 《计算机仿真》 2024年第4期522-526,共5页
为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利... 为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利用LSTM网络建立文本向量,存取以往和将来的上下文,融合前后两种输出矢量。运用激活函数压缩单词维度,计算句子上下文本语义贡献权重,在双向LSTM层和输出层间加入自注意力机制,从多角度获取矩阵层次的句子语义,计算组合句子特征矢量在关系上的分数,根据给定概率随机抽样权值参变量,完成复杂文本实体关系抽取。通过实验证明所提方法对复杂文本实体关系抽取效果较好,具有极高的精准度。 展开更多
关键词 自注意力机制 关系抽取 文本向量模型 复杂文本实体
下载PDF
基于实体-关系模型的标准元数据关系研究 被引量:1
17
作者 赵青青 《标准科学》 2023年第3期16-20,66,共6页
本文梳理了编目学中“关系”的发展历程,结合实体-关系模型,分析标准文献包含的实体、属性,并基于实体间的关联关系和属性关系,开展标准元数据关系研究,同时提出下一步应用方向,包括加强实体关系抽取技术研究、构建标准标签集、开展知... 本文梳理了编目学中“关系”的发展历程,结合实体-关系模型,分析标准文献包含的实体、属性,并基于实体间的关联关系和属性关系,开展标准元数据关系研究,同时提出下一步应用方向,包括加强实体关系抽取技术研究、构建标准标签集、开展知识链接研究等。 展开更多
关键词 标准元数据 实体-关系模型 实体 关系
下载PDF
基于BERT模型的电网基建工程知识图谱特征提取方法
18
作者 黄为 张莉 《科学技术创新》 2024年第19期29-32,共4页
由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通... 由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通过关系(即边)之间的联系,实现对电网基建工程知识图谱目标特征的有效提取。在测试结果中,设计方法对于不同特征,对应的提取结果F1值基本稳定在0.90以上,最大值达到了0.94,与对照组相比,在稳定性和有效性方面具有较为明显的优势。 展开更多
关键词 BerT模型 电网基建工程知识图谱 特征提取 工程实体 关联关系 三元组 数据解析
下载PDF
基于BERT—BiLSTM—CRF模型的中文岩石描述文本命名实体与关系联合提取 被引量:6
19
作者 陈忠良 袁峰 +1 位作者 李晓晖 张明明 《地质论评》 CAS CSCD 北大核心 2022年第2期742-750,共9页
地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—... 地质调查正在从“数字化”走向“智能化”,需要在大数据思维的指导下,面向非结构化数据开展机器阅读和地质知识的自动提取。地学命名实体和关系联合提取是当前研究的难点和核心。本文采用基于大规模预训练中文语言模型的BERT—BiLSTM—CRF方法开展岩石描述文本命名实体与关系联合提取。首先,通过收集数字地质填图工作中的剖面测量和路线地质观测数据,建立岩石描述语料;然后,在岩石学理论指导下分析岩石知识组成,完成岩石知识图谱命名实体与关系的模式设计,标注岩石语料;最后,开展岩石描述语料知识提取的深度学习训练和消融试验对比。试验结果显示,大规模预训练中文语言模型(BERT)对岩石描述语料知识提取具有较高的适用性。推荐的BERT—BiLSTM—CRF模型方法对岩石命名实体与关系联合提取的准确率(F1值)为91.75%,对岩石命名实体识别的准确率(F1值)为97.38%。消融试验证明基于BERT的词嵌入层对岩石描述知识提取的性能提升影响显著,双向长短时记忆网络模型层(BiLSTM Layer)能提升实体关系联合提取性能。 展开更多
关键词 大数据思维 深度学习 预训练中文语言模型 命名实体识别 关系提取
下载PDF
基于BERT-GRU-ATT模型的中文实体关系分类 被引量:10
20
作者 赵丹丹 黄德根 +2 位作者 孟佳娜 董宇 张攀 《计算机科学》 CSCD 北大核心 2022年第6期319-325,共7页
实体关系分类作为自然语言处理的基础任务,对知识图谱、智能问答、语义网构建等任务都起到了非常关键的作用。文中构建了BERT-GRU-ATT模型,以进行中文实体关系分类。为消除中文分词歧义对实体关系分类的影响,引入预训练模型BERT作为嵌入... 实体关系分类作为自然语言处理的基础任务,对知识图谱、智能问答、语义网构建等任务都起到了非常关键的作用。文中构建了BERT-GRU-ATT模型,以进行中文实体关系分类。为消除中文分词歧义对实体关系分类的影响,引入预训练模型BERT作为嵌入层,以较好地获得汉字的上下文信息;再通过双向门控循环单元捕获实体在句子中的长距离依赖,通过自注意力机制加强对关系分类贡献明显的字的权重,从而获得较好的实体关系分类结果。为了丰富中文实体关系分类语料,将SemEval2010_Task8英文实体关系评测语料翻译为中文^(1)),该模型在此翻译语料上取得了75.46%的F1值,说明了所提模型的有效性。此外,所提模型在SemEval2010-task8英文数据集上F1值达到了80.55%,证明该模型对英文语料具有一定的泛化能力。 展开更多
关键词 中文实体关系分类 预训练模型 门控循环单元 自注意力机制
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部