期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多模型融合的电力运检命名实体识别
1
作者 孙玉芹 肖静婷 王海超 《科学技术与工程》 北大核心 2023年第36期15545-15552,共8页
为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-ter... 为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-term,HCB)模型方法研究了电力运检命名实体识别问题。HCB模型分为两层,第一层使用隐马尔可夫模型(hidden Markov model,HMM)、条件随机场(conditional random fields,CRF)和双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)模型进行训练预测,再将预测结果输入第二层的CRF模型进行训练,经过双层模型训练预测得出最后的命名实体。结果表明:在电力运检命名实体识别问题上HCB模型的精确率、召回率及F1值等指标明显优于单模型以及其他的融合模型。可见HCB模型能有效解决电力运检命名实体识别问题。 展开更多
关键词 电力运检知识图谱 模型融合 命名实体识别 隐马尔可夫-条件随机-双向长短期记忆网络(HCB)模型
下载PDF
基于方剂数据集的知识图谱构建研究
2
作者 李灿 镇可涵 +1 位作者 唐东昕 解丹 《世界中医药》 CAS 北大核心 2024年第9期1329-1333,共5页
目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库... 目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库构建知识图谱。结果:最终遴选出基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场(BERT-BiLSTM-CRF)模型,从数据集中抽取出症状、中西医病名、中医证候等医学实体,平均F1值达90.55%,形成了规范的方剂数据集并构建了方剂知识图谱。结论:利用本文方法抽取出的医学实体为中医药的临床实践和科学研究提供了系统性展示方剂实体及其之间关系的可靠数据基础。所建立的方剂知识图谱实现了中药方剂的知识检索,不仅有助于发现方剂数据中的潜在知识与内在关系,而且为中医药领域的信息整合和知识发现提供了坚实基础,推动中医药的现代化进程。 展开更多
关键词 方剂 数据处理 知识图谱 规范化 命名实体识别 Neo4j图数据库 基于transformer的双向编码模型-双向长短期记忆网络-条件随机场模型 中医药
下载PDF
一种基于特征融合的医疗病例实体识别方法
3
作者 帅英杰 《广西职业技术学院学报》 2022年第2期63-68,共6页
在医学领域,传统的命名实体识别方法在医疗病历实体识别过程中,存在文本提取特征单一及不充分等问题,导致模型识别精准度不高。针对此问题,文章提出一种基于语义、词序、BER T预训练模型相结合的多特征融合提取方法。引入Word2vec对文... 在医学领域,传统的命名实体识别方法在医疗病历实体识别过程中,存在文本提取特征单一及不充分等问题,导致模型识别精准度不高。针对此问题,文章提出一种基于语义、词序、BER T预训练模型相结合的多特征融合提取方法。引入Word2vec对文本进行语义特征提取,利用Fasttext对文本的词序特征进行提取,通过BER T预训练模型获取词向量,解决Word2vec无法解决一词多义的问题。将多元特征向量融合,对相关数据的特征进行提取融合。通过卷积神经网络对融合特征进行再提取,得到更有价值的数据特征。最后通过双向长短时记忆神经网络结合条件随机场模型(BiLSTM-CRF)进行实体识别。实验结果表明:此方法在ChineseBLUE(cMedQANER)数据集上,其精准度、召回率、F1-Measure值等评价指标都有显著的提升。 展开更多
关键词 医疗病历 实体识别方法 双向transformer编码模型(BERT)预训练词向量 文本卷积神经网络 长短记忆神经网络 条件随机
下载PDF
针刺临床文献自然语言处理中术语的智能化标注和抽取方法 被引量:5
4
作者 刘华云 韩晨静 +3 位作者 熊婕 李海燕 雷蕾 刘保延 《中国针灸》 CAS CSCD 北大核心 2022年第3期327-331,共5页
分析针刺临床文献术语识别任务的特殊性,对比目前应用于中医药领域的3种命名实体识别(NER方法的优缺点,认为双向长短期记忆神经网络-条件随机场模型(Bi LSTM-CRF)能结合上下文信息,利用较少的特征规律完成NER,适合针刺临床文献的术语识... 分析针刺临床文献术语识别任务的特殊性,对比目前应用于中医药领域的3种命名实体识别(NER方法的优缺点,认为双向长短期记忆神经网络-条件随机场模型(Bi LSTM-CRF)能结合上下文信息,利用较少的特征规律完成NER,适合针刺临床文献的术语识别。在此模型基础上,提出针刺临床文献术语识别流程主要包括文献预处理、序列标注、模型训练及效果评价4个方面,为针刺临床文献术语结构化提供思路。 展开更多
关键词 针刺临床文献 术语识别 命名实体识别 双向长短期记忆神经网络-条件随机模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部