期刊文献+
共找到253篇文章
< 1 2 13 >
每页显示 20 50 100
Power entity recognition based on bidirectional long short-term memory and conditional random fields 被引量:8
1
作者 Zhixiang Ji Xiaohui Wang +1 位作者 Changyu Cai Hongjian Sun 《Global Energy Interconnection》 2020年第2期186-192,共7页
With the application of artificial intelligence technology in the power industry,the knowledge graph is expected to play a key role in power grid dispatch processes,intelligent maintenance,and customer service respons... With the application of artificial intelligence technology in the power industry,the knowledge graph is expected to play a key role in power grid dispatch processes,intelligent maintenance,and customer service response provision.Knowledge graphs are usually constructed based on entity recognition.Specifically,based on the mining of entity attributes and relationships,domain knowledge graphs can be constructed through knowledge fusion.In this work,the entities and characteristics of power entity recognition are analyzed,the mechanism of entity recognition is clarified,and entity recognition techniques are analyzed in the context of the power domain.Power entity recognition based on the conditional random fields (CRF) and bidirectional long short-term memory (BLSTM) models is investigated,and the two methods are comparatively analyzed.The results indicated that the CRF model,with an accuracy of 83%,can better identify the power entities compared to the BLSTM.The CRF approach can thus be applied to the entity extraction for knowledge graph construction in the power field. 展开更多
关键词 Knowledge graph entity recognition Conditional Random fields(CRF) Bidirectional Long Short-Term Memory(BLSTM)
下载PDF
A CONDITIONAL RANDOM FIELDS APPROACH TO BIOMEDICAL NAMED ENTITY RECOGNITION 被引量:4
2
作者 Wang Haochang Zhao Tiejun Li Sheng Yu Hao 《Journal of Electronics(China)》 2007年第6期838-844,共7页
Named entity recognition is a fundamental task in biomedical data mining. In this letter, a named entity recognition system based on CRFs (Conditional Random Fields) for biomedical texts is presented. The system mak... Named entity recognition is a fundamental task in biomedical data mining. In this letter, a named entity recognition system based on CRFs (Conditional Random Fields) for biomedical texts is presented. The system makes extensive use of a diverse set of features, including local features, full text features and external resource features. All features incorporated in this system are described in detail, and the impacts of different feature sets on the performance of the system are evaluated. In order to improve the performance of system, post-processing modules are exploited to deal with the abbreviation phenomena, cascaded named entity and boundary errors identification. Evaluation on this system proved that the feature selection has important impact on the system performance, and the post-processing explored has an important contribution on system performance to achieve better resuits. 展开更多
关键词 Conditional Random fields (CRFs) Named entity recognition Feature selection Post-processing
下载PDF
Recognition of Chinese Organization Name Using Co-training
3
作者 柯逍 李绍滋 陈锦秀 《Journal of Donghua University(English Edition)》 EI CAS 2010年第2期193-198,共6页
Chinese organization name recognition is hard and important in natural language processing. To reduce tagged corpus and use untagged corpus,we presented combing Co-training with support vector machines (SVM) and condi... Chinese organization name recognition is hard and important in natural language processing. To reduce tagged corpus and use untagged corpus,we presented combing Co-training with support vector machines (SVM) and conditional random fields (CRF) to improve recognition results. Based on principles of uncorrelated and compatible,we constructed different classifiers from different views within SVM or CRF alone and combination of these two models. And we modified a heuristic untagged samples selection algorithm to reduce time complexity. Experimental results show that under the same tagged data,Co-training has 10% F-measure higher than using SVM or CRF alone; under the same F-measure,Co-training saves at most 70% of tagged data to achieve the same performance. 展开更多
关键词 CO-TRAINING named entity recognition conditional random fields CRF) support vector machines (SVM)
下载PDF
融合知识的文博领域低资源命名实体识别方法研究
4
作者 李超 侯霞 乔秀明 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期13-22,共10页
文物数据的实体嵌套问题明显,实体边界不唯一,且文博领域已标注数据极度缺乏,导致该领域命名实体识别性能较低。针对这些问题,构建一个可用于文物命名实体识别的数据集FewRlicsData,提出一种融合知识的文博领域低资源命名实体识别方法Re... 文物数据的实体嵌套问题明显,实体边界不唯一,且文博领域已标注数据极度缺乏,导致该领域命名实体识别性能较低。针对这些问题,构建一个可用于文物命名实体识别的数据集FewRlicsData,提出一种融合知识的文博领域低资源命名实体识别方法RelicsNER。该方法将类别描述信息的语义知识融入文物文本中,使用基于跨度的方式进行解码,用于改善实体嵌套问题,并采用边界平滑的方式缓解跨度识别模型的过度自信问题。与基线模型相比,该方法在FewRlicsData数据集上的F1值有所提升,在文博领域命名实体识别任务中取得较好的性能。在公开数据集OntoNotes 4.0上的实验结果证明该方法具有较好的泛化性,同时在数据集OntoNotes 4.0和MSRA上进行小规模数据实验,性能均高于基线模型,说明所提方法适用于低资源场景。 展开更多
关键词 文博领域 命名实体识别 知识融合 注意力机制
下载PDF
融合词汇边界信息的合同实体识别方法
5
作者 王浩畅 和婷婷 郑冠彧 《计算机工程与设计》 北大核心 2024年第6期1757-1763,共7页
针对合同中实体表达形式复杂多变、识别粒度细的特点,及合同文本中实体较长问题,提出一种融合词汇边界信息的合同实体识别方法。利用预训练语言模型动态生成语义向量作为模型输入;运用相对位置编码对Transformer结构进行改进,使其在编... 针对合同中实体表达形式复杂多变、识别粒度细的特点,及合同文本中实体较长问题,提出一种融合词汇边界信息的合同实体识别方法。利用预训练语言模型动态生成语义向量作为模型输入;运用相对位置编码对Transformer结构进行改进,使其在编码过程中融合词汇信息,进一步丰富语义特征;通过条件随机场(CRF)结构进行解码,得到输入序列的标签预测。实验结果表明,该方法可以有效确定合同文本中的实体边界,具有良好的泛化性能。 展开更多
关键词 实体识别 合同文本 预训练语言模型 相对位置编码 转换器结构 词汇边界信息 条件随机场
下载PDF
面向采购文件的跨模态图片文本命名实体识别 被引量:1
6
作者 杨赛 刘昕 于绍文 《计算机工程与应用》 CSCD 北大核心 2024年第3期213-219,共7页
智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Ve... 智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Vector-Bi-LSTM-CRF),从图片文本中识别命名实体。该模型针对光学字符识别技术识别出的图片文本字符,定义连续文本字符边界,将边界内每个文本字符映射为向量,设计双向长短期记忆(Bi-LSTM)网络捕获边界内字符序列的上下文语义,计算字符状态分数矩阵,并通过条件随机场约束字符标记序列规则,获得全局最优标记序列。针对训练集计算命名实体预测误差,动态优化O2V2BLC模型的参数,实现命名实体识别。将该方法应用于采购文件资质类型等图片文本数据,能够有效识别图片中的投标单位、专家姓名、专业名称等命名实体,与条件随机场、隐马尔可夫算法、Bert-Bi-LSTM-CRF模型进行对比,显著提高了实体识别准确率,为智慧供应链的数智化采购提供支持。 展开更多
关键词 智慧供应链 命名实体识别 光学字符识别 双向长短期记忆网络 条件随机场
下载PDF
中文医疗文本中的嵌套实体识别方法
7
作者 闫璟辉 宗成庆 徐金安 《软件学报》 EI CSCD 北大核心 2024年第6期2923-2935,共13页
实体识别是信息抽取的关键技术.相较于普通文本,中文医疗文本的实体识别任务往往面对大量的嵌套实体.以往识别实体的方法往往忽视了医疗文本本身所特有的实体嵌套规则而直接采用序列标注方法,为此,提出一种融合实体嵌套规则的中文实体... 实体识别是信息抽取的关键技术.相较于普通文本,中文医疗文本的实体识别任务往往面对大量的嵌套实体.以往识别实体的方法往往忽视了医疗文本本身所特有的实体嵌套规则而直接采用序列标注方法,为此,提出一种融合实体嵌套规则的中文实体识别方法.所提方法在训练过程中将实体的识别任务转化为实体的边界识别与边界首尾关系识别的联合训练任务,在解码过程中结合从实际医疗文本中所总结出来的实体嵌套规则对解码结果进行过滤,从而使得识别结果能够符合实际文本中内外层实体嵌套组合的组成规律.在公开的医疗文本实体识别的实验上取得良好的效果.数据集上的实验表明,所提方法在嵌套类型实体识别性能上显著优于已有的方法,在整体准确率方面比最先进的方法提高0.5%. 展开更多
关键词 实体识别 中文文本 医疗领域 嵌套实体识别 边界识别
下载PDF
基于增强优化预训练语言模型的电力数据实体识别方法 被引量:1
8
作者 田雪涵 董坤 +1 位作者 赵剑锋 郭希瑞 《智慧电力》 北大核心 2024年第6期100-107,共8页
知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原... 知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原始数据集,采用增强优化预训练语言模型(RoBERTa)进行动态语义编码,利用双向长短期记忆网络(BiLSTM)和条件随机场(CRF)提取特征并优化标签。实验结果表明,该实体识别方法比传统基于深度学习的实体识别方法的平均数指标F1分数高2.17%,证实其对构建电力数据知识图谱的识别效果。 展开更多
关键词 知识图谱 实体识别 数据增强 预训练语言模型 双向长短期记忆网络 条件随机场
下载PDF
基于BERT的电子病历命名实体识别 被引量:2
9
作者 郑立瑞 肖晓霞 +2 位作者 邹北骥 刘彬 周展 《计算机与现代化》 2024年第1期87-91,共5页
电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技... 电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技术进行诊疗规律挖掘。为了高效识别电子病历中的命名实体,提出一种融合对抗训练(FGM)的基于BERT与双向长短期记忆网络(BILSTM)的命名实体识别方法(BERT-BILSTM-CRF-FGM,BBCF),对2017全国知识图谱与语义计算大会(CCKS2017)提供的中文电子病历语料做修正等预处理后,采用BBCF模型识别该语料中5种实体的平均F1值为92.84%,比基于膨胀卷积网络的BERT模型(BERT-IDCNN-CRF)和基于BILSTM的条件随机场模型(BILSTM-CRF)有更高的F1值和更快的收敛速度,能够更加高效地结构化电子病历文本。 展开更多
关键词 电子病历 命名实体识别 BERT FGM 双向长短期记忆网络 条件随机场
下载PDF
基于多头注意力的中文电子病历命名实体识别
10
作者 肖丹 杨春明 +2 位作者 张晖 赵旭剑 李波 《计算机应用与软件》 北大核心 2024年第1期133-138,160,共7页
针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法。该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标... 针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法。该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标签的预测。实验结果表明,该方法F1值达89.16%,其中治疗和疾病两类实体分别达到94.76%和95.56%。 展开更多
关键词 命名实体识别 中文电子病历 多头注意力 长短期记忆网络 条件随机场
下载PDF
基于字符注意力与词典特征的教育领域实体识别
11
作者 王萌 刘春刚 赵华 《计算机技术与发展》 2024年第7期168-174,共7页
针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字... 针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字向量,提出基于词性的字符注意力机制重新分配句子中字的权重。然后与构建的教育领域词典特征拼接融合,将其输入到BiLSTM网络与IDCNN网络提取特征,通过注意力机制将两层的输出动态组合,对两层的输出进行加权,从而融合新的特征。最后通过条件随机场进行计算,得到实体对应的标签序列。与现有方法相比,该方法在教育学科领域文本库中获得了更高的精度,识别结果的准确率、召回率、F1值分别为90.71%,91.37%,91.04%。 展开更多
关键词 实体识别 词典特征 字符注意力 IDCNN 条件随机场
下载PDF
融合先验知识和字形特征的中文命名实体识别
12
作者 董永峰 白佳明 +1 位作者 王利琴 王旭 《计算机应用》 CSCD 北大核心 2024年第3期702-708,共7页
针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入... 针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入序列进行编码,并从中文维基百科中获取实体类型的中文释义,采用双向门控循环单元(BiGRU)编码实体类型信息作为先验知识,利用注意力机制将它与字符表示进行组合;其次,采用双向长短时记忆(BiLSTM)网络编码输入序列的远距离依赖关系,通过字形编码表获得繁体的仓颉码和简体的现代五笔码,采用卷积神经网络(CNN)提取字形特征表示,并根据不同权重组合繁体与简体字形特征,利用门控机制将它与经过BiLSTM编码后的字符表示进行组合;最后,使用条件随机场(CRF)解码,得到命名实体标注序列。在偏口语化的数据集Weibo、小型数据集Boson和大型数据集PeopleDaily上的实验结果表明,与基线模型MECT(Multi-metadata Embedding based Cross-Transformer)相比,所提模型的F1值别提高了2.47、1.20和0.98个百分点,验证了模型的有效性。 展开更多
关键词 命名实体识别 注意力机制 卷积神经网络 双向长短时记忆 条件随机场
下载PDF
顾及上下文语境的交通命名实体自动识别方法
13
作者 王树杰 马照亭 +1 位作者 吴政 杨健男 《测绘工程》 2024年第2期65-70,共6页
网络文本中蕴含着大量的交通信息,对交通命名实体识别是地情变化监测、交通实体更新的重要前提。针对交通命名实体识别任务中缺少专业标注数据和有效识别方法导致识别效果无法满足需求的问题,文中提出一种融合深度学习模型的交通命名实... 网络文本中蕴含着大量的交通信息,对交通命名实体识别是地情变化监测、交通实体更新的重要前提。针对交通命名实体识别任务中缺少专业标注数据和有效识别方法导致识别效果无法满足需求的问题,文中提出一种融合深度学习模型的交通命名实体自动提取方法。该方法首先利用语言表征模型充分融合语境来提取文本特征,然后通过结合双向神经网络模型来学习上下文语境,最终由条件随机场模型对输出进行约束得到全局最优标记序列实现交通实体的识别。实验证明,该方法准确率可以达到90%以上,能够实现对交通实体的有效识别。 展开更多
关键词 交通命名实体 命名实体识别 双向神经网络 条件随机场
下载PDF
基于BioBERT与BiLSTM的临床试验纳排标准命名实体识别
14
作者 李盛青 苏前敏 黄继汉 《中国医学物理学杂志》 CSCD 2024年第1期125-132,共8页
目的:提出一种基于BioBERT预训练模型的纳排标准命名实体识别方法(BioBERT-Att-BiLSTM-CRF),可自动提取临床试验相关信息,为高效制定纳排标准提供帮助。方法:结合UMLS医学语义网络和专家定义方式,制定医学实体标注规则,并建立命名实体... 目的:提出一种基于BioBERT预训练模型的纳排标准命名实体识别方法(BioBERT-Att-BiLSTM-CRF),可自动提取临床试验相关信息,为高效制定纳排标准提供帮助。方法:结合UMLS医学语义网络和专家定义方式,制定医学实体标注规则,并建立命名实体识别语料库以明确实体识别任务。BioBERT-Att-BiLSTM-CRF首先将文本转换为BioBERT向量并输入至双向长短期记忆网络以捕捉上下文语义特征;同时运用注意力机制来提取关键特征;最终采用条件随机场解码并输出最优标签序列。结果:BioBERT-Att-BiLSTM-CRF在纳排标准命名实体识别数据集上的效果优于其他基准模型。结论:使用BioBERT-Att-BiLSTM-CRF能更高效地提取临床试验的纳排标准相关信息,从而增强临床试验注册数据的科学性,并为临床试验纳排标准的制定提供帮助。 展开更多
关键词 纳排标准 命名实体识别 双向长短期记忆网络 条件随机场 临床试验
下载PDF
基于字词向量的BiLSTM-CRF水利工程巡检文本实体识别模型 被引量:1
15
作者 刘雪梅 程彭圣男 +3 位作者 李海瑞 曹闯 高英 崔培 《华北水利水电大学学报(自然科学版)》 北大核心 2024年第3期9-17,共9页
命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提... 命名实体识别是构建水利知识图谱的核心技术。水利工程巡检文本是水利工程最为常见的数据类型,以文本形式记录,没有固定格式与结构,但其包含水利工程安全潜在风险信息,具有价值密度高的特点。针对水利工程巡检文本命名实体识别问题,提出字词向量融合的BiLSTM-CRF模型,首先将巡检文本分别在字维度和词维度进行向量化处理,合并字词向量获取字词向量特征;然后利用BiLSTM神经网络获取序列化后的上下文特征;最后通过CRF进行解码并提取相应实体。以南水北调中线工程巡检文本为例,实验结果表明:字词向量结合之后的方法能有效提高识别性能,对实体边界的识别效果更优,模型准确率、召回率和F1值分别可以达到93.79%、93.06%、93.42%;时间效率较BERT-BiLSTM-CRF模型的时间效率提高82.86%。基于字词向量的BiLSTM-CRF模型可为水利工程知识图谱的快速构建提供技术支撑。 展开更多
关键词 巡检文本 实体识别 双向长短期记忆神经网络 Word2Vec 条件向量场
下载PDF
基于匹配词权重优化的中文命名实体识别方法
16
作者 戴高阳 孟小艳 +2 位作者 张容祯 陈燕红 汪洋 《计算机与数字工程》 2024年第2期521-527,共7页
命名实体识别是知识抽取中的重要任务之一,为了更有效地利用词典匹配信息,提出了基于匹配词权重优化的中文命名实体识别模型。首先利用与训练模型和分词工具获得每个字符的向量表示和词性标注;然后在词典中匹配潜在词组,跟据匹配词词频... 命名实体识别是知识抽取中的重要任务之一,为了更有效地利用词典匹配信息,提出了基于匹配词权重优化的中文命名实体识别模型。首先利用与训练模型和分词工具获得每个字符的向量表示和词性标注;然后在词典中匹配潜在词组,跟据匹配词词频和文档计数的优化权重对词组加权,结合字符向量得到字符的多特征融合表示;最后使用双向长短期记忆网络(Bi-directional Long-Short Term Memory,Bi-LSTM)网络进行训练,使用条件随机场(Conditional Random Field,CRF)完成标签推理得到识别实体。试验结果表明,该模型在Resume和影视-音乐-书籍数据集上的F1值分别达到了95.55%和85.39%,有效地提高了中文命名实体识别效果。 展开更多
关键词 命名实体识别 循环神经网络 条件随机场 词典匹配 权重优化
下载PDF
面向机加工艺规程文本的实体识别模型
17
作者 董含笑 李豫虎 +1 位作者 乔立红 黄志成 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期313-320,共8页
为实现非结构化工艺规程文本中关键信息的高效识别,建立一种基于机加工领域词典和神经网络的命名实体识别模型.首先,结合机加工领域词典与jieba分词技术进行数据集的自动标注,并在对工艺参数信息进行标注的过程中将数字和标志字母划分... 为实现非结构化工艺规程文本中关键信息的高效识别,建立一种基于机加工领域词典和神经网络的命名实体识别模型.首先,结合机加工领域词典与jieba分词技术进行数据集的自动标注,并在对工艺参数信息进行标注的过程中将数字和标志字母划分为一个分词单位以增强后续特征提取效果;其次,在word2vec词嵌入的基础上,采用双向长短时记忆网络对文本进行特征提取;最后,采用条件随机场综合上下文逻辑以提高关键工艺信息的识别准确率.在包含431条工步内容的数据集上,对所提模型的识别效果进行实验,结果表明,所提模型的准确率、召回率和F1值分别为90.20%,93.88%和92.00%,在与领域内传统模型的对比上具有一定优势,并使用3个不同工艺规程数据集验证了该模型的鲁棒性. 展开更多
关键词 双向长短时记忆网络 条件随机场 命名实体识别 知识抽取
下载PDF
面向武器装备领域的复杂三元组抽取方法
18
作者 游新冬 刘陌村 +2 位作者 葛昊杰 肖刚 吕学强 《小型微型计算机系统》 CSCD 北大核心 2024年第3期521-528,共8页
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对... 为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对抗的方式,实现模型层面的数据增强,减少模型对标注样本规模的依赖;采用单层指针网络获取头实体对头实体的类别进行判定,利用维基百科知识库对武器装备领域的实体类别解释信息的向量,对武器装备类别信息以字为最小粒度进行融合,缓解分层标注的天然缺陷;最后在横纵两个维度基于不同粒度的序列标注实现复杂三元组的抽取.在武器装备领域的数据集上精准率达到88.54%,召回率达到75.88%,F1值达到81.72%,取得了SOTA效果.实验表明提出的RDA方法对武器装备领域的信息利用更加充分,有效地缓解武器装备领域遇到的单实体重叠问题(SEO)和实体对重叠(EPO)问题. 展开更多
关键词 三元组抽取 武器装备领域 复杂命名实体识别 单层指针网络 多轮对抗攻击 RDA
下载PDF
基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用
19
作者 彭彬 田宜平 +2 位作者 曾斌 吴雪超 吴文明 《地质科技通报》 CAS CSCD 北大核心 2024年第4期224-234,共11页
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立... 随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。 展开更多
关键词 地质实体识别 XLNET-BILSTM-Attention-CRF 磷矿成矿模式 预训练模型 序列标注
下载PDF
基于ERNIE-BiGRU-Attention-CRF的电子病历命名实体识别方法
20
作者 王正芳 张军亮 +2 位作者 李小倩 于月 陈慧媜 《医学信息学杂志》 CAS 2024年第5期76-82,100,共8页
目的/意义改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘。方法/过程构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获... 目的/意义改善中文电子病历命名实体识别模型的性能,更好地开展医疗信息的组织和挖掘。方法/过程构建ERNIE-BiGRU-Attention-CRF中文电子病历命名实体识别模型,首先采用ERNIE1.0预训练模型生成具有语义特征的词向量,然后利用BiGRU捕获全局语义特征与语法结构特征,通过Attention机制进一步增强语义特征的捕获,最后连接CRF解码层输出全局概率最大的标签序列。结果/结论在公开的医疗文本数据集CCKS2017开展对比实验、消融实验,利用生成的模型进行实例分析,取得较好的识别效果。 展开更多
关键词 命名实体识别 ERNIE 双向门控循环神经网络 注意力机制 条件随机场
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部