期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
基于ChatGLM和提示微调的旅游知识图谱构建
1
作者 徐春 苏明钰 孙彬 《科学技术与工程》 北大核心 2024年第31期13484-13492,共9页
为缓解旅游领域知识分散、信息碎片化的问题,提出一种基于ChatGLM(chat generative language model)和提示微调的实体关系抽取模型ChatGLM-ppt(ChatGLM with prompt and p-tuning)。该模型借助ChatGLM以对话形式完成实体关系抽取任务,... 为缓解旅游领域知识分散、信息碎片化的问题,提出一种基于ChatGLM(chat generative language model)和提示微调的实体关系抽取模型ChatGLM-ppt(ChatGLM with prompt and p-tuning)。该模型借助ChatGLM以对话形式完成实体关系抽取任务,并通过P-Tuning v2微调和添加提示模板的方法应对实体关系抽取中错误传播、实体冗余和关系重叠等问题。实验建立在自建的旅游领域数据集上,结果表明:在旅游领域实体关系抽取问题上ChatGLM-ppt模型F 1为92.19%,在处理重叠关系问题中F 1均大于90%,优于目前主流的实体关系抽取模型,证明该模型可有效提高实体关系抽取的准确率。进一步运用Neo4j图数据库构建旅游知识图谱,整合分散的旅游信息资源,对促进旅游业的数字化转型和智能化发展具有一定的参考意义。 展开更多
关键词 实体关系抽取 关系重叠 大语言模型 知识图谱
下载PDF
基于BERT古文预训练模型的实体关系联合抽取
2
作者 李智杰 杨盛杰 +3 位作者 李昌华 张颉 董玮 介军 《计算机系统应用》 2024年第8期187-195,共9页
古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模... 古汉语文本承载着丰富的历史和文化信息,对这类文本进行实体关系抽取研究并构建相关知识图谱对于文化传承具有重要作用.针对古汉语文本中存在大量生僻汉字、语义模糊和复义等问题,提出了一种基于BERT古文预训练模型的实体关系联合抽取模型(entity relation joint extraction model based on BERT-ancient-Chinese pretrained model,JEBAC).首先,通过融合BiLSTM神经网络和注意力机制的BERT古文预训练模型(BERT-ancientChinese pre-trained model integrated BiLSTM neural network and attention mechanism,BACBA),识别出句中所有的subject实体和object实体,为关系和object实体联合抽取提供依据.接下来,将subject实体的归一化编码向量与整个句子的嵌入向量相加,以更好地理解句中subject实体的语义特征;最后,结合带有subject实体特征的句子向量和object实体的提示信息,通过BACBA实现句中关系和object实体的联合抽取,从而得到句中所有的三元组信息(subject实体,关系,object实体).在中文实体关系抽取DuIE2.0数据集和CCKS 2021的文言文实体关系抽取CCLUE小样本数据集上,与现有的方法进行了性能比较.实验结果表明,该方法在抽取性能上更加有效,F1值分别可达79.2%和55.5%. 展开更多
关键词 古汉语文本 实体关系抽取 BERT古文预训练模型 BiLSTM 注意力 三元组信息
下载PDF
基于实体级联类型的中文关系抽取管道模型
3
作者 饶东宁 吴倩梅 黄观琚 《计算机应用研究》 CSCD 北大核心 2024年第9期2685-2689,共5页
端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时... 端到端实体关系抽取任务可以被分解成命名实体识别和关系抽取两个子任务,最近的工作多将这两个子任务联合建模。现有的流水线方法验证了在关系模型中融合实体类型信息的重要性和管道模型的潜力,但是它们忽略了文本中的某些实体可能同时具有多个类型,这种多义性的情况在中文数据集中尤为常见。为解决上述问题,提出了一种实体级联类型机制,并在此基础上开发了一个更适合中文关系抽取的管道模型,取名为CENTRELINE。该流水线方法的实体模块是一个词-词关系分类模型,它以BERT和双向LSTM作为编码器、经过条件层归一化后引入空洞卷积,最后通过级联类型预测器输出实体及其级联类型。关系模块的输入仅由实体模块构建。该方法在DuIE1.0、DuIE2.0和CMeIE-V2数据集上的F_(1)值分别比基线方法提高了7.23、6.93和8.51百分点,并在DuIE1.0和DuIE2.0数据集上都实现了最先进的性能。消融实验表明,提出的级联类型机制和根据中文语言特征改进的管道模型,均对关系抽取性能具有明显的促进作用。 展开更多
关键词 中文关系抽取 管道模型 空洞卷积 实体级联类型
下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型
4
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
下载PDF
融合交互注意力网络的实体和关系联合抽取模型 被引量:1
5
作者 郝小芳 张超群 +1 位作者 李晓翔 王大睿 《计算机工程与应用》 CSCD 北大核心 2024年第8期156-164,共9页
实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实... 实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实体和关系联合抽取模型RSIAN,该模型通过交互注意力网络来学习句子级别和关系级别的高阶语义关联,增强句子和关系之间的交互,辅助模型进行抽取决策。在构建的中文旅游数据集(TDDS)的Precision、Recall和F1值分别为0.872、0.760和0.812,其性能均优于其他对比模型;为了进一步验证该模型在英文联合抽取上的性能,在公开英文数据集NYT和Webnlg上进行实验,该模型的F1值相比基线模型RSAN模型分别提高了0.014和0.013,并且该模型在重叠三元组的分析实验也均取得了优于基线模型的性能且更稳定。 展开更多
关键词 交互注意力网络 句子级别 关系级别 实体和关系联合抽取 注意力机制 重叠三元组
下载PDF
基于实体-联系模型的中医药标准关系模型构建研究
6
作者 何心如 李静 桑珍 《中国中医药信息杂志》 CAS CSCD 2024年第4期20-25,共6页
体量日趋庞大的中医药标准为制修订工作和综合管理带来严峻挑战,利用数字技术为标准赋能具有重要战略意义。本研究通过对中医药标准名称信息的深度挖掘和解读,提出基于实体-联系模型的标准间关系建模方法,构建包含7种关系模式的关系模型... 体量日趋庞大的中医药标准为制修订工作和综合管理带来严峻挑战,利用数字技术为标准赋能具有重要战略意义。本研究通过对中医药标准名称信息的深度挖掘和解读,提出基于实体-联系模型的标准间关系建模方法,构建包含7种关系模式的关系模型,并以标准检索为例展示模型的应用场景,为机器读取和使用标准、提高中医药标准检索效率、掌握目标标准相关资源、推动中医药标准数字化转型提供支撑。 展开更多
关键词 实体-联系模型 关系模型 中医药标准 标准名称 数字化转型
下载PDF
基于对span的预判断和多轮分类的实体关系抽取
7
作者 佟缘 姚念民 《计算机工程与科学》 CSCD 北大核心 2024年第5期916-928,共13页
针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块... 针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块。Smrc模型通过Pej模块的初步判断及Emr模块的多轮实体分类来进行实体识别,再利用Rmr模块的多轮关系分类来判断实体对间的关系,进而完成关系抽取任务。在CoNLL04、SciERC和ADE 3个实验数据集上,Smrc模型的实体识别F1值分别达到89.67%,70.62%和89.56%,关系抽取F1值分别达到73.11%,51.03%和79.89%,相较之前在3个数据集上的最佳模型Spert,Smrc模型凭借实体预判断和实体及关系多轮分类,在2个子任务上其F1值分别提高了0.73%,0.29%,0.61%及1.64%,0.19%,1.05%,表明了该模型的有效性及其优势。 展开更多
关键词 对span的预判断 实体关系抽取 BERT预训练模型 多轮实体分类 多轮关系分类
下载PDF
基于预训练的藏医药实体关系抽取
8
作者 周青 拥措 +1 位作者 拉毛东只 尼玛扎西 《中文信息学报》 CSCD 北大核心 2024年第8期76-83,共8页
藏医药领域的文本主要以非结构化形式保存,藏医药文本的信息抽取对挖掘藏医药的知识有重要作用。针对现有藏文实体关系抽取模型语义表达能力差、嵌套实体抽取准确率低的问题,该文介绍了一种基于预训练模型的实体关系抽取方法,使用Tibeta... 藏医药领域的文本主要以非结构化形式保存,藏医药文本的信息抽取对挖掘藏医药的知识有重要作用。针对现有藏文实体关系抽取模型语义表达能力差、嵌套实体抽取准确率低的问题,该文介绍了一种基于预训练模型的实体关系抽取方法,使用TibetanAI_ALBERT_v2.0预训练语言模型,使得模型更好地识别实体,使用Span方法解决实体嵌套问题。在Dropout的基础上,增加了一个KL散度损失函数项,提升了模型的泛化能力。在TibetanAI_TMIE_v1.0藏医药数据集上进行了实验,实验结果表明,精确率、召回率和F1值分别达到了84.5%、80.1%和82.2%,F1值较基线提升了4.4个百分点,实验结果证明了该文方法的有效性。 展开更多
关键词 藏医药 实体关系抽取 预训练语言模型
下载PDF
面向缝纫设备运维管理的语言模型构建方法研究 被引量:1
9
作者 刘冰 刘莹 +2 位作者 郑小虎 李廨晨 杜思淇 《Journal of Donghua University(English Edition)》 CAS 2024年第3期315-322,共8页
缝纫设备的智能运维与管理,关键在于解决非结构化文本的信息挖掘及语言模型构建问题。这对于加快设备缺陷和故障诊断速度、提高诊断准确性及实现设备检修的智能辅助决策,具有重要意义。该研究提出了通过基于BERT的条件随机场(bidirectio... 缝纫设备的智能运维与管理,关键在于解决非结构化文本的信息挖掘及语言模型构建问题。这对于加快设备缺陷和故障诊断速度、提高诊断准确性及实现设备检修的智能辅助决策,具有重要意义。该研究提出了通过基于BERT的条件随机场(bidirectional encoder representations from transformers-conditional random field,BERT-CRF)的实体抽取模型抽取关键实体信息,如设备名称、属性等,再通过基于双向门控循环单元注意力机制(bidirectional gated recurrent unit-attention,BiGRU-Attention)的关系抽取模型有效捕捉实体之间的语义关联,为缝纫设备知识图谱的构建提供支持。针对缝纫设备文本分析场景,模型在缝纫设备文本实体识别、信息抽取和故障诊断等任务场景进行了专门的训练和优化。与现有的深度学习算法相比,该研究所提方法在验证集和测试集上实现了20%到30%的性能提升,体现了其在召回率和精确度上的显著优势。缝纫设备知识的非结构化文本信息挖掘,可为平缝设备数据集成、设备故障运维、平缝工艺路线设计等方面的知识图谱构建提供参考。 展开更多
关键词 缝纫设备运行管理 语言模型 实体抽取 关系抽取 知识图谱
下载PDF
自注意力机制下复杂文本实体关系抽取方法
10
作者 针钰 马晓宁 《计算机仿真》 2024年第4期522-526,共5页
为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利... 为了能够明确语义关系,快速识别所需信息,提出一种自注意力机制下复杂文本实体关系抽取方法。通过复杂文本向量模型把全部词映射为低度实数向量,使文本转变成矢量模式,按照单词的外在情境学习嵌入,可将句子内的所有字转化为嵌入矩阵。利用LSTM网络建立文本向量,存取以往和将来的上下文,融合前后两种输出矢量。运用激活函数压缩单词维度,计算句子上下文本语义贡献权重,在双向LSTM层和输出层间加入自注意力机制,从多角度获取矩阵层次的句子语义,计算组合句子特征矢量在关系上的分数,根据给定概率随机抽样权值参变量,完成复杂文本实体关系抽取。通过实验证明所提方法对复杂文本实体关系抽取效果较好,具有极高的精准度。 展开更多
关键词 自注意力机制 关系抽取 文本向量模型 复杂文本实体
下载PDF
矿山知识图谱构建的实体关系抽取方法研究
11
作者 杨森森 李海涛 +1 位作者 杜伟升 薛珊珊 《煤炭技术》 CAS 2024年第11期259-263,共5页
知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准... 知识图谱描述实体及其关系,对煤矿管理、安全监控等提供支撑。构建煤矿知识图谱面临数据多样性和语义关系挑战。提出一种基于ALBERT-BiLSTM-Att-CRF的方法,通过特征提取、上下文捕捉、注意力机制和CRF层优化实体关系抽取,展示较高的准确率和F1值,为煤矿智能化提供技术支撑。 展开更多
关键词 矿山 知识图谱 实体关系抽取 ALBERT-BiLSTM-Att-CRF模型
下载PDF
双关系预测与特征融合的实体关系抽取模型
12
作者 沈健 夏鸿斌 刘渊 《智能系统学报》 CSCD 北大核心 2024年第2期462-471,共10页
现有分阶段解码的实体关系抽取模型仍存在着阶段间特征融合不充分的问题,会增大曝光偏差对抽取性能的影响。为此,提出一种双关系预测和特征融合的实体关系抽取模型(entity relation extraction model with dual relation prediction and... 现有分阶段解码的实体关系抽取模型仍存在着阶段间特征融合不充分的问题,会增大曝光偏差对抽取性能的影响。为此,提出一种双关系预测和特征融合的实体关系抽取模型(entity relation extraction model with dual relation prediction and feature fusion,DRPFF),该模型使用预训练的基于Transformer的双向编码表示模型(bidirectional encoder representation from transformers,BERT)对文本进行编码,并设计两阶段的双关系预测结构来减少抽取过程中错误三元组的生成。在阶段间通过门控线性单元(gated linear unit,GLU)和条件层规范化(conditional layer normalization,CLN)组合的结构来更好地融合实体之间的特征。在NYT和WebNLG这2个公开数据集上的试验结果表明,该模型相较于基线方法取得了更好的效果。 展开更多
关键词 实体关系抽取 关系三元组 预训练模型 双关系预测 指针网络 特征融合 门控线性单元 条件层规范化
下载PDF
基于预训练模型的药物不良事件抽取方法研究
13
作者 袁驰 李计巧 +1 位作者 王正瑶 王怀玉 《医学信息学杂志》 CAS 2024年第2期38-43,共6页
目的/意义研究医学文本药物不良事件数据抽取方法,为临床用药风险管理和科学决策提供支持。方法/过程基于预训练模型,结合实体识别和关系抽取两个子任务的关联性,设计面向药物不良事件监测的实体关系联合抽取方法。结果/结论在公开药物... 目的/意义研究医学文本药物不良事件数据抽取方法,为临床用药风险管理和科学决策提供支持。方法/过程基于预训练模型,结合实体识别和关系抽取两个子任务的关联性,设计面向药物不良事件监测的实体关系联合抽取方法。结果/结论在公开药物不良事件抽取数据集上的实验表明,该方法优于已有方法,能够有效地从医学文本中提取药物不良事件信息及其关系,为药物不良事件的发现与监测提供有力手段。 展开更多
关键词 药物不良事件 实体关系抽取 预训练模型 自然语言处理 医学
下载PDF
基于知识图谱的变压器匝间短路故障辨识研究
14
作者 查易艺 王翀 张明明 《自动化仪表》 CAS 2024年第4期14-18,共5页
变压器出现的故障数据间的关联性没有被较好地利用,会直接影响变压器匝间短路故障的辨识准确性。为此,提出基于知识图谱的变压器匝间短路故障辨识研究。基于柔性策略采集变压器数据,根据实际运行情况及数据采集目标需求,调整数据采集量... 变压器出现的故障数据间的关联性没有被较好地利用,会直接影响变压器匝间短路故障的辨识准确性。为此,提出基于知识图谱的变压器匝间短路故障辨识研究。基于柔性策略采集变压器数据,根据实际运行情况及数据采集目标需求,调整数据采集量及时间间隔。根据采集到的变压器数据,采用本体构建、实体抽取、关系抽取和图谱构建的步骤构建知识图谱。将提取的知识图谱故障样本特征,输入到你只看一次(YOLO)v4检测模型中。通过YOLOv4检测模型与知识图谱结合的检测方法,完成变压器匝间短路故障的自动辨识。试验结果表明:变压器匝间短路故障自动辨识的准确率、召回率和F值均较高,因而辨别及时性高、自动辨别效果好。该研究解决了传统方法中存在的问题,具有重要的现实意义。 展开更多
关键词 知识图谱 变压器 匝间短路故障 实体抽取 你只看一次v4检测模型 柔性策略 关系抽取
下载PDF
基于BERT模型的电网基建工程知识图谱特征提取方法
15
作者 黄为 张莉 《科学技术创新》 2024年第19期29-32,共4页
由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通... 由于电网基建工程涉及因素较多,导致在对其知识图谱特征进行提取时,F1值难以得到保障,为此,本文章提出基于BERT模型的电网基建工程知识图谱特征提取方法研究。以RDF模型为基础,构建了以三元组为基本单元的电网基建工程知识图谱模型;通过关系(即边)之间的联系,实现对电网基建工程知识图谱目标特征的有效提取。在测试结果中,设计方法对于不同特征,对应的提取结果F1值基本稳定在0.90以上,最大值达到了0.94,与对照组相比,在稳定性和有效性方面具有较为明显的优势。 展开更多
关键词 BERT模型 电网基建工程知识图谱 特征提取 工程实体 关联关系 三元组 数据解析
下载PDF
一种基于大语言模型的威胁情报信息抽取方法
16
作者 马冰琦 周盈海 +1 位作者 王梓宇 田志宏 《网络空间安全科学学报》 2024年第2期36-46,共11页
随着网络攻防对抗日益激烈,威胁情报的深度挖掘与有效利用成为提升网络安全防御策略的关键。针对传统信息抽取技术在训练数据构建和模型泛化能力方面的局限性,提出了一种基于大语言模型(Large Language Models,LLMs)的威胁情报实体及其... 随着网络攻防对抗日益激烈,威胁情报的深度挖掘与有效利用成为提升网络安全防御策略的关键。针对传统信息抽取技术在训练数据构建和模型泛化能力方面的局限性,提出了一种基于大语言模型(Large Language Models,LLMs)的威胁情报实体及其相互关系抽取框架。借助LLMs的深度语义理解能力,通过提示工程技术准确抽取威胁实体及其相互关系,同时辅以LangChain扩展抽取广度。此外,通过搜索引擎集成提高情报挖掘的时效性和准确性。实验结果显示,该框架在少样本或零样本情境下表现出色,有效减少了误导信息的生成,实现了实时高效的情报知识提取。总体而言,引入一种灵活高效的威胁情报智能化挖掘方法,优化了威胁情报的知识融合过程,提升了网络防御的主动性与先进性。 展开更多
关键词 威胁情报 大语言模型 实体关系抽取 提示工程 LangChain
下载PDF
基于3D辅助器的结构楼板钢筋安装施工技术
17
作者 郝瑾 《广东土木与建筑》 2024年第3期113-115,共3页
以某工程为例,对基于3D辅助器的结构楼板钢筋安装施工技术进行研究,综述了采用三维设计软件建立钢筋安装辅助器模型图,运用3D打印技术打印出实体,施工时将各类板筋压入钢筋安装辅助器的对应卡口中,保证了保护层厚度,提高了钢筋定位安装... 以某工程为例,对基于3D辅助器的结构楼板钢筋安装施工技术进行研究,综述了采用三维设计软件建立钢筋安装辅助器模型图,运用3D打印技术打印出实体,施工时将各类板筋压入钢筋安装辅助器的对应卡口中,保证了保护层厚度,提高了钢筋定位安装精度和速度等一系列创新技术,确保了结构楼板钢筋安装分层清晰、定位准确、保护层厚度一致。 展开更多
关键词 3D辅助器 三维设计软件 位置关系数据 钢筋安装辅助器模型图 3D打印技术 对应卡口 定位准确 实体
下载PDF
词嵌入BERT-CRF玉米育种实体关系联合抽取方法 被引量:1
18
作者 李书琴 庞文婷 《农业机械学报》 EI CAS CSCD 北大核心 2023年第11期286-294,共9页
针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉... 针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉米育种语料表达特征,采用对实体边界、关系类别和实体位置信息同步标注的策略;其次,构建了嵌入词汇信息的BERT-CRF模型进行训练和预测,自建玉米育种知识词典,通过在BERT中嵌入词汇信息,融合字符特征和词汇特征,增强模型的语义能力,利用CRF模型输出全局最优标签序列,设计了实体关系三元组匹配算法(Entity and relation triple matching algorithm,ERTM),将标签进行匹配和映射来获取三元组;最后,为验证该方法的有效性,在玉米育种数据集上进行实验,结果表明,本文模型精确率、召回率和F1值分别为91.84%、95.84%、93.80%,与现有模型相比性能均有提升。说明该方法能够有效抽取玉米育种领域知识,为构建玉米育种知识图谱及其它下游任务提供数据基础。 展开更多
关键词 玉米育种 实体关系联合抽取 序列标注 BERT语言模型 词嵌入
下载PDF
面向地质领域的实体关系联合抽取研究 被引量:2
19
作者 吴雪莹 段友祥 +2 位作者 昌伦杰 李世银 孙歧峰 《计算机工程》 CAS CSCD 北大核心 2023年第3期121-127,共7页
构建地质领域的知识图谱有助于便捷高效地共享和应用多源地质知识,而地质关系三元组抽取对地质领域知识图谱构建具有重要意义。针对现有实体关系联合抽取模型无法有效识别重叠三元组的问题,考虑地质领域专业知识的特殊性,基于预训练语... 构建地质领域的知识图谱有助于便捷高效地共享和应用多源地质知识,而地质关系三元组抽取对地质领域知识图谱构建具有重要意义。针对现有实体关系联合抽取模型无法有效识别重叠三元组的问题,考虑地质领域专业知识的特殊性,基于预训练语言模型BERT建立一种用于地质领域关系三元组抽取的层级标注模型HtERT。采用中文预训练语言模型BERT-wwm替代原始的BERT模型作为底层编码器,以提高模型对中文的编码能力。在实体识别阶段,引入关于实体起始位置的嵌入表示来限制实体的抽取长度,从而提升实体识别的准确度。引入全局上下文信息和BiLSTM网络使得模型抽取到的特征能更精确地表示地质样本信息,增强模型对地质关系三元组以及重叠三元组的抽取能力。在地质领域数据集上的实验结果表明,HtERT模型相比于PCNN、BiLSTM、PCNN+ATT、CASREL等基线模型具有明显优势,精确率、召回率以及F1值分别平均提升15.24、10.96和13.20个百分点,验证了该模型在地质领域实体关系联合抽取任务中的有效性。 展开更多
关键词 实体关系抽取 联合抽取 重叠三元组 地质领域 预训练模型BERT
下载PDF
基于双向语义的中文实体关系联合抽取方法 被引量:8
20
作者 禹克强 黄芳 +1 位作者 吴琪 欧阳洋 《计算机工程》 CAS CSCD 北大核心 2023年第1期92-99,112,共9页
现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERT... 现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERTa预训练模型获取具有上下文信息的文本字向量表征,通过首尾指针标注识别句子中可能存在关系的实体。为了同时利用文本中的双向关系语义信息,将实体分别作为关系中的主体与客体来建立正负关系,并利用两组全连接神经网络构建正负关系映射器,从而对每一个输入实体同时从正关系与负关系的角度构建候选关系三元组。将候选关系三元组分别在正负关系下的概率分布序列与实体位置嵌入特征相结合,以对候选三元组进行判别,从而确定最终的关系三元组。在DuIE数据集上进行对比实验,结果表明,该方法的精确率与召回率优于MultiR、CoType等基线模型,其F1值达到0.805,相较基线模型平均提高了12.8%。 展开更多
关键词 实体关系联合抽取 双向关系语义 正负关系映射 全连接神经网络 预训练语言模型
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部