期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别 被引量:2
1
作者 高国忠 李宇 +1 位作者 华远鹏 吴文旷 《长江大学学报(自然科学版)》 2024年第1期57-65,共9页
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from... 针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型。 展开更多
关键词 油气领域 命名实体识别 bert 双向长短期记忆网络 条件随机场 bert-bilstm-crf模型
下载PDF
基于BERT-BiLSTM-CRF模型的地理实体命名实体识别 被引量:6
2
作者 汤洁仪 李大军 刘波 《北京测绘》 2023年第2期143-147,共5页
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学... 互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。 展开更多
关键词 地理实体 命名实体识别(NER) 知识抽取 bert-bilstm-crf模型
下载PDF
基于BERT-BILSTM-CRF模型的电力行业事故文本智能分析 被引量:4
3
作者 刘斐 文中 吴艺 《中国安全生产科学技术》 CAS CSCD 北大核心 2023年第1期209-215,共7页
为解决电力行业事故报告文本较长、语义复杂,难以进行有效文本识别问题,提出1种以BERT作为底层的预训练模型,并设计1种双重注意力机制编码器,结合BILSTM-CRF深度挖掘事故文本语义特征,从而实现文本智能分析。首先构建电力词典,通过对BER... 为解决电力行业事故报告文本较长、语义复杂,难以进行有效文本识别问题,提出1种以BERT作为底层的预训练模型,并设计1种双重注意力机制编码器,结合BILSTM-CRF深度挖掘事故文本语义特征,从而实现文本智能分析。首先构建电力词典,通过对BERT预训练,进行BIO标注,然后引入BILSTM-CRF模型实现对文本标签智能分类,最后将该模型与现行其他4种深度学习模型进行对比。研究结果表明:该模型智能识别精确率、召回率及F 1值(查准率)均达到约97%,较其他4种模型中效果最好的模型分别提高0.02,0.03,0.02。研究结果可为电力行业事故报告文本分析提供1种新思路。 展开更多
关键词 bert-bilstm-crf 实体识别 电力行业 预训练 文本分类
下载PDF
融合汉字部首的BERT-BiLSTM-CRF中医医案命名实体识别模型 被引量:1
4
作者 刘彬 肖晓霞 +3 位作者 邹北骥 周展 郑立瑞 谭建聪 《医学信息学杂志》 CAS 2023年第6期48-53,共6页
目的/意义研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据。方法/过程提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采... 目的/意义研究提取中医医案中医疗术语的方法,实现医案自动结构化,为医案知识发现提供结构化数据。方法/过程提出一种BERT结合长短期记忆人工神经网络、条件随机场和部首特征的深度学习命名实体识别模型,在BERT词向量中嵌入汉字部首,采用双向长短期记忆人工神经网络提取实体特征,使用条件随机场进行序列预测。将人工标注的400份共计5万余字的医案按照3∶1划分为训练集和测试集,使用该模型识别中医医案中的身体部位、药物、症状、疾病4类命名实体。结果/结论该模型在测试集F 1值为84.81%,优于其他未嵌入部首的模型,表明该模型能够更有效地识别中医医案中的命名实体,更好地结构化医案。 展开更多
关键词 实体识别 部首特征 bert模型 双向长短期记忆模型 条件随机场 自然语言处理
下载PDF
基于BERT-BiLSTM-CRF的电力集控安全隐患数据处理
5
作者 张滈辰 屈红军 +1 位作者 牛雪莹 耿琴兰 《通信电源技术》 2023年第21期24-27,共4页
为了提高电力集控系统安全隐患数据处理的效果,提出一种基于来自变换器的双向编码器表示-双向长短期记忆网络-条件随机场(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short Term Memory-Conditional ... 为了提高电力集控系统安全隐患数据处理的效果,提出一种基于来自变换器的双向编码器表示-双向长短期记忆网络-条件随机场(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short Term Memory-Conditional Random Fields,BERT-BiLSTM-CRF)的电力集控安全隐患数据处理方法。构建电力集控隐患数据检测模型,应用改进长短时记忆网络(Long Short Term Memory,LSTM)来构建电力集控安全隐患数据修复网络,实现电力集控安全隐患数据处理。实验结果表明,采用所提方法能够更好地完成电力集控安全隐患数据检测与修复,应用效果较好。 展开更多
关键词 来自变换器的双向编码器表示(bert) 双向长短期记忆网络(bilstm) 条件随机场(crf) 电力集控系统 安全隐患数据检测 数据修复
下载PDF
基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究 被引量:49
6
作者 吴俊 程垚 +3 位作者 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡 《情报学报》 CSSCI CSCD 北大核心 2020年第4期409-418,共10页
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练... 专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。 展开更多
关键词 bert bilstm crf 专业术语抽取
下载PDF
基于实体级遮蔽BERT与BiLSTM-CRF的农业命名实体识别 被引量:10
7
作者 韦紫君 宋玲 +1 位作者 胡小春 陈宁江 《农业工程学报》 EI CAS CSCD 北大核心 2022年第15期195-203,共9页
字符的位置信息和语义信息对命名方式繁杂且名称长度较长的中文农业实体的识别至关重要。为解决命名实体识别过程中由于捕获字符位置信息、上下文语义特征和长距离依赖信息不充足导致识别效果不理想的问题,该研究提出一种基于EmBERT-BiL... 字符的位置信息和语义信息对命名方式繁杂且名称长度较长的中文农业实体的识别至关重要。为解决命名实体识别过程中由于捕获字符位置信息、上下文语义特征和长距离依赖信息不充足导致识别效果不理想的问题,该研究提出一种基于EmBERT-BiLSTM-CRF模型的中文农业命名实体识别方法。该方法采用基于Transformer的深度双向预训练语言模型(Bidirectional Encoder Representation from Transformers,BERT)作为嵌入层提取字向量的深度双向表示,并使用实体级遮蔽策略使模型更好地表征中文语义;然后使用双向长短时记忆网络(BidirectionalLong Short-Term Memory,BiLSTM)学习文本的长序列语义特征;最后使用条件随机场(Conditional Random Field,CRF)在训练数据中学习标注约束规则,并利用相邻标签之间的信息输出全局最优的标注序列。训练过程中使用了焦点损失函数来缓解样本分布不均衡的问题。试验在构建的语料库上对农作物品种、病害、虫害和农药4类农业实体进行识别。结果表明,该研究的EmBERT-BiLSTM-CRF模型对4类农业实体的识别性能相较于其他模型有明显提升,准确率为94.97%,F1值为95.93%。 展开更多
关键词 农业 命名实体识别 实体级遮蔽 bert bilstm crf
下载PDF
基于BERT-BiLSTM-CRF的中文地址解析方法 被引量:6
8
作者 吴恪涵 张雪英 +2 位作者 叶鹏 怀安 张航 《地理与地理信息科学》 CSCD 北大核心 2021年第4期10-15,共6页
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基... 中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力。以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能。 展开更多
关键词 中文地址 地址要素分类 地址标注 bert-bilstm-crf 地址解析模型
下载PDF
基于BERT-BiLSTM-CRF模型的中文实体识别 被引量:81
9
作者 谢腾 杨俊安 刘辉 《计算机系统应用》 2020年第7期48-55,共8页
命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一... 命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一步提高.为解决该问题,本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法.首先通过BERT模型预处理生成基于上下文信息的词向量,其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理.实验结果表明,该模型在MSRA语料和人民日报语料库上都达到相当不错的结果,F1值分别为94.65%和95.67%. 展开更多
关键词 命名实体识别 bert模型 双向长短期记忆网络 条件随机场 词向量
下载PDF
基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法 被引量:1
10
作者 陈逸墨 叶辉 +3 位作者 易珺 周华文 方丹丹 曹东 《自动化与信息工程》 2022年第2期35-40,共6页
随着电子病历数据开放共享的需求越来越大,电子病历去隐私性问题亟需解决。利用自然语言处理技术,提出一种基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法。采用某三甲中医院的电子病历作为数据来源,结合当前公开的数据集进行训练... 随着电子病历数据开放共享的需求越来越大,电子病历去隐私性问题亟需解决。利用自然语言处理技术,提出一种基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法。采用某三甲中医院的电子病历作为数据来源,结合当前公开的数据集进行训练,得到正确率为94.02%、召回率为94.25%、F1为93.98%的中医电子病历隐私信息识别模型。与其他传统模型进行对比实验表明,Bert-BiLSTM-CRF模型能有效识别并保护电子病历中的隐私数据,有助于医疗数据的开放共享。 展开更多
关键词 隐私信息 bert 双向长短时记忆网络 条件随机场 电子病历
下载PDF
融合BERT模型与词汇增强的中医命名实体识别模型
11
作者 李旻哲 殷继彬 《计算机科学》 CSCD 北大核心 2024年第S01期122-127,共6页
现有的中医命名实体识别相关研究较少,基本都是基于中文病例做相关研究,在传统中医编写的病例文本中表现不佳。针对中医案例中命名实体密集且边界模糊难以划分的特点,提出了一种融合词汇增强和预训练模型的中医命名实体识别方法LEBERT-B... 现有的中医命名实体识别相关研究较少,基本都是基于中文病例做相关研究,在传统中医编写的病例文本中表现不佳。针对中医案例中命名实体密集且边界模糊难以划分的特点,提出了一种融合词汇增强和预训练模型的中医命名实体识别方法LEBERT-BILSTM-CRF。该方法从词汇增强和预训练模型融合的角度进行优化,将词汇信息输入到BERT模型中进行特征学习,达到划分词类边界和区分词类属性的目的,提高中医医案命名实体识别的精度。实验结果表明,在文中构建的中医病例数据集上针对10个实体进行命名实体识别时,提出的基于LEBERT-BILSTM-CRF的中医案例命名实体识别模型综合准确率、召回率、F1分别为88.69%,87.4%,88.1%,高于BERT-CRF,LEBERT-CRF等常用命名实体识别模型。 展开更多
关键词 自然语言处理 中医案例 词汇增强 bert BLSTM-crf
下载PDF
基于Bert-BiLSTM-CRF的中医文本命名实体识别 被引量:21
12
作者 屈倩倩 阚红星 《电子设计工程》 2021年第19期40-43,48,共5页
命名实体识别是中医智能化发展的基石。针对中医文本数据挖掘中实体识别困难的问题,构建了基于Bert-BiLSTM-CRF的命名实体识别模型。通过Bert模型在字向量的构建过程中融入注意力机制,利用BiLSTM进行特征提取,并将特征输入CRF模型之中... 命名实体识别是中医智能化发展的基石。针对中医文本数据挖掘中实体识别困难的问题,构建了基于Bert-BiLSTM-CRF的命名实体识别模型。通过Bert模型在字向量的构建过程中融入注意力机制,利用BiLSTM进行特征提取,并将特征输入CRF模型之中完成最终的训练。实验选取《伤寒论》作为训练集以及测试集,划分症状、疾病名称、方剂、中药名、时间5类实体。测试集上的结果表明,该模型的准确率为96.94%,召回率为93.14%,F值为95%,命名实体识别精度较高,可以将该模型用于实际问题中。 展开更多
关键词 命名实体识别 bert bilstm crf
下载PDF
基于BERT和领域词典融合的中文电子病历命名实体识别
13
作者 叶恩光 张晓如 +3 位作者 张再跃 丁腊春 朱向南 王译 《计算机与数字工程》 2024年第3期746-750,767,共6页
医疗数据挖掘的起始环节为CNER(中文电子病历命名实体识别),将相关实体(解剖部位、药品、影像检查等)识别出非结构化文本是其目标所在。基于CNER准确性提升需要,论文设计了BERT-BiLSTM-CRF模型融合领域词典技术,该技术能将上下文语义关... 医疗数据挖掘的起始环节为CNER(中文电子病历命名实体识别),将相关实体(解剖部位、药品、影像检查等)识别出非结构化文本是其目标所在。基于CNER准确性提升需要,论文设计了BERT-BiLSTM-CRF模型融合领域词典技术,该技术能将上下文语义关系全面结合,一词多义问题同样可以迎刃而解,获取电子病历句子的长距离依赖。CNER采用BERT-BiLSTM-CRF模型融合领域词典技术时的F1值已经被实验结果所证实,对知识图谱的构建、临床决策支持系统和病历质控系统等的研究有着重要意义。 展开更多
关键词 中文电子病历 命名实体识别 bert-bilstm-crf 领域词典
下载PDF
基于知识图谱与BERT-BiLSTM-CRF模型的中文电子病历实体识别研究 被引量:5
14
作者 梁怀众 庄培锋 +1 位作者 彭宏 王继伟 《中国数字医学》 2022年第8期43-47,共5页
目的:提出一种基于医疗知识图谱的BERT-BiLSTM-CRF命名实体识别模型(MKG-BERT-BiLC),用于解决BERT类语言模型在处理医疗电子病历命名实体识别任务时,由于缺乏一定医疗领域背景知识而导致无法充分发挥其作用的问题。方法:将医疗知识图谱... 目的:提出一种基于医疗知识图谱的BERT-BiLSTM-CRF命名实体识别模型(MKG-BERT-BiLC),用于解决BERT类语言模型在处理医疗电子病历命名实体识别任务时,由于缺乏一定医疗领域背景知识而导致无法充分发挥其作用的问题。方法:将医疗知识图谱中的三元组信息集成到BERT-BiLSTM-CRF模型中,可实现为模型配备相应的医疗领域知识,进而增强模型的语言表征能力。结果:利用现有公开数据集进行实验,融入知识图谱后BERT-BiLSTM-CRF模型的识别精确率、召回率和F1值均有显著提升,优于现有NER模型。结论:MKG-BERT-BiLC模型能够更好地识别电子病历中的命名实体,具有一定的实用价值。 展开更多
关键词 知识图谱 bert-bilstm-crf 电子病历 命名实体识别
下载PDF
基于BERT的命名实体识别
15
作者 赵英明 王浩森 赵明瞻 《河北建筑工程学院学报》 CAS 2024年第1期253-257,共5页
在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BER... 在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BERT微调训练对计算机性能要求较高的问题,采用了固定参数嵌入的方式对BERT进行应用,并搭建了BERT-BiLSTM-CRF模型。实验结果表明,基于BERT的命名实体识别模型在MSRA数据集上的F1-Score指标达到94.48%。优于传统机器学习模型和其他基于深度学习模型的方法。研究结果表明,BERT模型在命名实体识别任务中具有很好的应用前景。 展开更多
关键词 命名实体识别 bert 微调 bert-bilstm-crf模型 深度学习
下载PDF
采用BERT-BiLSTM-CRF模型的中文位置语义解析 被引量:4
16
作者 邓庆康 李晓林 《软件导刊》 2022年第2期37-42,共6页
针对利用当前神经网络模型进行中文位置语义解析存在多义词解析效果差、泛化能力差等问题,提出一种基于BERT-BiLSTM-CRF模型的中文位置语义解析方法。首先利用BERT预训练模型对中文位置信息进行预训练,获取所有层中的上下文信息,增强中... 针对利用当前神经网络模型进行中文位置语义解析存在多义词解析效果差、泛化能力差等问题,提出一种基于BERT-BiLSTM-CRF模型的中文位置语义解析方法。首先利用BERT预训练模型对中文位置信息进行预训练,获取所有层中的上下文信息,增强中文位置信息的语义表征能力,然后通过BiLSTM模型提取向量特征信息,最后通过CRF模型进行解码,获取全局最优标注序列。实验结果表明,在不同数量和区域的中文位置信息数据集基础上,BERT-BiLSTM-CRF模型在所有测试集上分词准确率与F1值都优于目前常用的神经网络模型,最高分别可达到93.91%和93.96%。利用BERT-BiLSTM-CRF模型对中文位置信息进行语义解析,不仅有效提高了中文位置信息解析与多义词解析的准确率,而且具有更好的泛化能力。 展开更多
关键词 中文位置语义解析 bert预训练模型 bilstm模型 crf模型
下载PDF
基于BERT-BiLSTM-CRF的SPECT诊断文本病灶提取研究
17
作者 张淋均 《信息与电脑》 2021年第5期87-89,共3页
随着医学成像技术的不断进步,有价值的数据越来越多,但是当前还无法充分利用这些数据,从而会造成资源浪费。基于此,笔者将SPECT诊断报告作为研究对象,将数据进行预处理后传入构建的BERT-BiLSTM-CRF框架,旨在实现诊断报告中病灶的自动提... 随着医学成像技术的不断进步,有价值的数据越来越多,但是当前还无法充分利用这些数据,从而会造成资源浪费。基于此,笔者将SPECT诊断报告作为研究对象,将数据进行预处理后传入构建的BERT-BiLSTM-CRF框架,旨在实现诊断报告中病灶的自动提取。实验结果表明,该方法能够有效完成核医学诊断文本的疾病表征自动提取,获得的精确度、召回率和F1-Score分别为92.21、94.14和93.17。 展开更多
关键词 SPECT诊断文本 命名实体识别 bert-bilstm-crf 结构化
下载PDF
基于ALBERT的网络威胁情报命名实体识别 被引量:1
18
作者 周景贤 王曾琪 《陕西科技大学学报》 北大核心 2023年第1期187-195,共9页
网络威胁情报实体识别是网络威胁情报分析的关键,针对传统词嵌入无法表征一词多义而难以有效识别网络威胁情报实体关键信息,同时面临指数级增长的威胁情报,识别模型的效率亟待提高等问题,提出一种基于ALBERT的网络威胁情报命名实体识别... 网络威胁情报实体识别是网络威胁情报分析的关键,针对传统词嵌入无法表征一词多义而难以有效识别网络威胁情报实体关键信息,同时面临指数级增长的威胁情报,识别模型的效率亟待提高等问题,提出一种基于ALBERT的网络威胁情报命名实体识别模型.该模型首先使用ALBERT提取威胁情报动态特征词向量,然后将特征词向量输入到双向长短期记忆网络(BiLSTM)层得到句子中每个词对应的标签,最后在条件随机场(CRF)层修正并以最大概率输出序列标签.识别模型对比实验结果显示,提出模型的F1值为92.21%,明显优于其他模型.在识别准确率相同的情况下,提出模型的时间和资源成本也较低,适用于网络威胁情报领域海量高效的实体识别任务. 展开更多
关键词 网络威胁情报 命名实体识别 bert ALbert 双向长短期记忆网络 条件随机场
下载PDF
面向技术识别的专利实体抽取--以类脑智能领域为例
19
作者 邢晓昭 苑朋彬 +2 位作者 陈亮 任亮 余池 《情报杂志》 北大核心 2024年第6期126-133,144,共9页
[研究目的]专利实体抽取是基于专利文本的技术识别的基础。目前专利实体抽取任务面临自动化程度和准确率较低等问题,该研究从两方面对此进行改进:一是建立特定领域的高质量专利语料库,二是将先进的算法模型运用到专利实体抽取中。[研究... [研究目的]专利实体抽取是基于专利文本的技术识别的基础。目前专利实体抽取任务面临自动化程度和准确率较低等问题,该研究从两方面对此进行改进:一是建立特定领域的高质量专利语料库,二是将先进的算法模型运用到专利实体抽取中。[研究方法]定义了包含13种实体类型的细粒度信息体系,并据此对921篇类脑智能专利的标题和摘要进行人工标注,此后运用Bert-BiLSTM-CRF模型,融合深度学习和机器学习对类脑智能专利实体进行识别。[研究结论]模型在总体上获得0.8的准确率、召回率和F1值,不同类型实体的识别效果具有差异。为了验证模型的性能,设计了几个对比实验。结果显示,微调数据和增加训练规模可以提高模型性能,本模型性能优于同时期一些经典模型。 展开更多
关键词 专利实体 专利文本 专利挖掘 技术识别 深度学习 机器学习 bert-bilstm-crf模型
下载PDF
面向物流标书关键信息的自动提取方法
20
作者 马静 俞瑛 《计算机与数字工程》 2024年第5期1400-1405,共6页
物流标书信息识别是物流企业精准获取商业情报的一项重要手段。物流招标公告作为情报来源,存在文本不规范、领域标签不足、抽取难度大等问题,因此目前尚缺乏对物流标书领域命名实体识别的研究。为准确识别物流标书中的有效信息,该研究... 物流标书信息识别是物流企业精准获取商业情报的一项重要手段。物流招标公告作为情报来源,存在文本不规范、领域标签不足、抽取难度大等问题,因此目前尚缺乏对物流标书领域命名实体识别的研究。为准确识别物流标书中的有效信息,该研究以中国物流招标网和物通网获取的物流招标公告作为实验数据集,构建了物流标书领域命名实体识别语料库,并提出一种融合BERT预训练的BiLSTM-CRF深度学习模型,以实现对招标公司、运输地点和运输项目三类实体的识别。实验结果表明,论文所提模型不但具有较优的实体识别准确度,同时还具备了较强的稳定性。 展开更多
关键词 物流标书 命名实体识别 深度学习 bert bilstm-crf
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部