期刊文献+
共找到314篇文章
< 1 2 16 >
每页显示 20 50 100
基于RoBERTa-CNN-BiLSTM-CRF的高中数学知识实体识别
1
作者 赵梓宏 单菁 王佳英 《人工智能与机器人研究》 2024年第1期121-129,共9页
命名实体识别是自然语言处理中的一个重要研究步骤,也是自然语言中许多下游任务的前置任务。传统的命名实体识别方法通常采用简单线性或非线性模型进行识别,实体识别的准确率不高。随着深度学习的引入,能够处理更为复杂的非线性问题,使... 命名实体识别是自然语言处理中的一个重要研究步骤,也是自然语言中许多下游任务的前置任务。传统的命名实体识别方法通常采用简单线性或非线性模型进行识别,实体识别的准确率不高。随着深度学习的引入,能够处理更为复杂的非线性问题,使用神经网络模型来提高实体识别的准确率。本文提出一种基于RoBERTa-CNN-BiLSTM-CRF模型,用于高中数学知识实体的识别任务。首先利用RoBERTa模型中的双向Transformer编码层对数据的特征进行提取与分析生成相应的词向量,然后利用卷积神经网络(CNN)中的卷积层和池化层实现降维操作,提取句子中的局部特征,最后构建适合高中数学知识点实体识别的LSTM-CRF模型进行训练和处理。经过实验表明,该模型具有较高的准确性。准确率、召回率和F1分别达到94.32%、94.58%和94.45%。 展开更多
关键词 高中数学知识实体识别 RoBERTa模型 CNN BiLSTM
下载PDF
层次融合多元知识的命名实体识别框架——HTLR
2
作者 吕学强 王涛 +1 位作者 游新冬 徐戈 《计算机应用》 北大核心 2025年第1期40-47,共8页
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hi... 中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 词汇增强 字形增强
下载PDF
基于命名实体识别的《神农本草经》知识图谱构建及可视化分析
3
作者 佟琳 张华敏 +4 位作者 佟旭 雷蕾 王程 曾子玲 杨洪军 《中国中医药信息杂志》 CAS CSCD 2024年第8期37-43,共7页
目的构建《神农本草经》知识图谱,分析本草知识、挖掘隐性知识并进行可视化展示,为古籍研究提供方法学参考。方法梳理并表述《神农本草经》文献涉及的知识实体类型和实体间关系,应用BIO序列标注方法生产训练语料数据集,使用自主研发的C... 目的构建《神农本草经》知识图谱,分析本草知识、挖掘隐性知识并进行可视化展示,为古籍研究提供方法学参考。方法梳理并表述《神农本草经》文献涉及的知识实体类型和实体间关系,应用BIO序列标注方法生产训练语料数据集,使用自主研发的CNLP文本标注系统进行文本标注,采用BERT模型识别命名实体,基于规则与语义关联设定确定实体间关系,经知识融合后,用Cypher语言导入图数据库Neo4j-community4.4.9进行存储和可视化展示,构建知识图谱。结果《神农本草经》知识图谱包含5273个节点、11064个关系,其模式层包含14种实体类、16种关系类型。可通过Cypher语言查询,从中药分类、药性理论、七情配伍、中药应用方面进行知识的可视化展示。结论本研究构建的知识图谱可直观反映《神农本草经》所载知识及隐性关系,适用于中医药古籍的知识挖掘及直观多维展示。 展开更多
关键词 知识图谱 神农本草经 本草知识 命名实体识别
下载PDF
融合知识的文博领域低资源命名实体识别方法研究
4
作者 李超 侯霞 乔秀明 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期13-22,共10页
文物数据的实体嵌套问题明显,实体边界不唯一,且文博领域已标注数据极度缺乏,导致该领域命名实体识别性能较低。针对这些问题,构建一个可用于文物命名实体识别的数据集FewRlicsData,提出一种融合知识的文博领域低资源命名实体识别方法Re... 文物数据的实体嵌套问题明显,实体边界不唯一,且文博领域已标注数据极度缺乏,导致该领域命名实体识别性能较低。针对这些问题,构建一个可用于文物命名实体识别的数据集FewRlicsData,提出一种融合知识的文博领域低资源命名实体识别方法RelicsNER。该方法将类别描述信息的语义知识融入文物文本中,使用基于跨度的方式进行解码,用于改善实体嵌套问题,并采用边界平滑的方式缓解跨度识别模型的过度自信问题。与基线模型相比,该方法在FewRlicsData数据集上的F1值有所提升,在文博领域命名实体识别任务中取得较好的性能。在公开数据集OntoNotes 4.0上的实验结果证明该方法具有较好的泛化性,同时在数据集OntoNotes 4.0和MSRA上进行小规模数据实验,性能均高于基线模型,说明所提方法适用于低资源场景。 展开更多
关键词 文博领域 命名实体识别 知识融合 注意力机制
下载PDF
基于知识图谱增强的领域多模态实体识别
5
作者 李华昱 张智康 +1 位作者 闫阳 岳阳 《计算机工程》 CAS CSCD 北大核心 2024年第8期31-39,共9页
针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet15... 针对特定领域中文命名实体识别存在的局限性,提出一种利用学科图谱和图像提高实体识别准确率的模型,旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTMAttention的模型提取文本特征,使用ResNet152提取图像特征,并使用分词工具获得句子中的名词实体。通过BERT将名词实体与图谱节点进行特征嵌入,利用余弦相似度查找句子中的分词在学科图谱中最相似的节点,保留到该节点距离为1的邻居节点,生成最佳匹配子图,作为句子的语义补充。使用多层感知机(MLP)将文本、图像和子图3种特征映射到同一空间,并通过独特的门控机制实现文本和图像的细粒度跨模态特征融合。最后,通过交叉注意力机制将多模态特征与子图特征进行融合,输入解码器进行实体标记。在Twitter2015、Twitter2017和自建计算机学科数据集上同基线模型进行实验比较,结果显示,所提方法在领域数据集上的精确率、召回率和F1值分别可达88.56%、87.47%和88.01%,与最优基线模型相比,F1值提高了1.36个百分点,表明利用领域知识图谱能有效提升实体识别效果。 展开更多
关键词 命名实体识别 多模态 领域 知识图谱 跨模态特征融合 注意力机制
下载PDF
融合标签知识的中文医学命名实体识别
6
作者 尹宝生 周澎 《计算机科学》 CSCD 北大核心 2024年第S01期128-134,共7页
医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学... 医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况。为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能。其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果。实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2)3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案。 展开更多
关键词 中文医学命名实体识别 标签知识 先验知识 自适应融合机制 小样本
下载PDF
一种融入领域知识的领域短文本命名实体识别方法
7
作者 戎纪光 任志国 李书强 《指挥控制与仿真》 2024年第3期123-129,共7页
针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词... 针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词嵌入处理,并基于词向量相似性计算,发现与待识别领域命名实体相似的关键知识实体,将其替换为关键知识实体后生成新的领域短文本,与未替换的领域短文本一同输入模型中进行命名实体识别,使领域知识融入领域短文本的命名实体识别过程,实验结果表明本方法较现有其他同类方法获得了较优的识别能力。 展开更多
关键词 知识图谱 知识实体 命名实体识别 双向长短期记忆网络
下载PDF
面向葡萄知识图谱构建的多特征融合命名实体识别 被引量:3
8
作者 聂啸林 张礼麟 +3 位作者 牛当当 吴华瑞 朱华吉 张宏鸣 《农业工程学报》 EI CAS CSCD 北大核心 2024年第3期201-210,共10页
为解决构建知识图谱过程中由于上下文环境复杂、现有模型字向量语义表征相对单一导致领域专业实体识别率低的问题,该研究提出了来自转换器的双向编码器表征量(bi-directional encoder representation from transformer,BERT)和残差结构(... 为解决构建知识图谱过程中由于上下文环境复杂、现有模型字向量语义表征相对单一导致领域专业实体识别率低的问题,该研究提出了来自转换器的双向编码器表征量(bi-directional encoder representation from transformer,BERT)和残差结构(residual structure,RS)融合的命名实体识别模型(bert based named entity recognition with residual structure,BBNER-RS)。通过BERT模型将文本映射为字符向量,利用双向长短时记忆网络(bi-directional long-short term memory,BiLSTM)提取局部字符向量特征,并采用RS保留BERT提供的全局字符向量特征,以提高字向量的语义丰富度,最后通过条件随机场(conditional random field,CRF)模型对特征向量解码,获取全局最优序列标注。与其他命名实体识别模型相比,提出的BBNER-MRS模型在葡萄数据集上表现较好,在葡萄人民日报、玻森、简历和微博数据集上F1值分别达到89.89%、95.02%、83.21%、96.15%和72.51%。最后该研究依托BBNER-MRS模型,提出基于深度学习的两阶段式领域知识图谱构建方法,成功构建了葡萄知识图谱,研究结果可为相关从业人员提供技术和数据支持。 展开更多
关键词 信息化 深度学习 知识图谱 命名实体识别 BERT 残差结构
下载PDF
融合多粒度语言知识与层级信息的中文命名实体识别模型 被引量:1
9
作者 于右任 张仰森 +1 位作者 蒋玉茹 黄改娟 《计算机应用》 CSCD 北大核心 2024年第6期1706-1712,共7页
针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文... 针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文本的细粒度和粗粒度语言信息,从而更好地表征语料;其次,使用ON-LSTM(Ordered Neurons Long Short-Term Memory network)模型提取层级信息,利用文本本身的层级结构信息增强编码间的时序关系;最后,在模型的解码端结合文本的分词信息,并将实体识别问题转化为表格填充问题,以更好地解决实体重叠问题并获得更准确的实体识别结果。同时,为解决当前模型在不同领域中的迁移能力较差的问题,提出通用实体识别的理念,通过筛选多领域的通用实体类型,构建一套提升模型在多领域中的泛化能力的通用NER数据集MDNER(Multi-Domain NER dataset)。为验证所提模型的效果,在数据集Resume、Weibo、MSRA上进行实验,与MECT(Multi-metadata Embedding based Cross-Transformer)模型相比,F1值分别提高了0.94、4.95和1.58个百分点。为了验证所提模型在多领域中的实体识别效果,在MDNER上进行实验,F1值达到了95.29%。实验结果表明,多粒度语言知识预训练、文本层级结构信息提取和高效指针解码器对模型的性能提升至关重要。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 高效指针 通用实体
下载PDF
融合注意力机制的蒙医药命名实体识别
10
作者 刘忠博 杨一帆 +3 位作者 白青海 周玉新 刁宇峰 张军 《内蒙古民族大学学报(自然科学版)》 2025年第1期28-35,共8页
目前蒙医药文本分布较为分散,缺乏系统化整理,构建蒙医药知识图谱成为解决这一问题的关键途径,其中命名实体识别(NER)技术发挥着关键作用。提出了一种基于BERT-BiGRU-CRF与注意力机制的NER模型,旨在解决蒙医药文本中实体识别问题,数据... 目前蒙医药文本分布较为分散,缺乏系统化整理,构建蒙医药知识图谱成为解决这一问题的关键途径,其中命名实体识别(NER)技术发挥着关键作用。提出了一种基于BERT-BiGRU-CRF与注意力机制的NER模型,旨在解决蒙医药文本中实体识别问题,数据来源包括公开发布的蒙医药文本以及蒙医的著作,并进行校正和完善。实验结果表明,所提出的模型在蒙医药命名实体识别任务中的F1值达到87.33%。在F1值上,相比于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-BiGRU-CRF模型分别提升了4.97%、1.82%和1.77%,不仅提升了蒙医药领域中NER的应用效果,还为蒙医药知识图谱的构建和文化传承提供了重要的技术支持。 展开更多
关键词 蒙医药知识图谱 命名实体识别 注意力机制 BERT
下载PDF
MKE: 基于背景知识与多头选择的嵌套命名实体识别
11
作者 李政 涂刚 汪汉生 《中文信息学报》 CSCD 北大核心 2024年第4期86-98,107,共14页
目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型... 目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型的改进包括:①引入领域背景知识,知识嵌入层以实体矩阵的形式,实现背景知识的无损嵌入;②将命名实体识别过程转化为多头选择过程,借助注意力打分模型,计算候选片段得分,最终在正确识别嵌套实体边界的同时实现实体多分类。实验结果表明,以实体矩阵方式实现的背景知识嵌入,可以有效提高识别准确率,在7个嵌套与非嵌套命名实体识别数据集上取得SOTA表现。 展开更多
关键词 嵌套命名实体识别 知识嵌入 多头选择 注意力 实体多分类
下载PDF
k-best维特比解耦合知识蒸馏的命名实体识别模型
12
作者 赵红磊 唐焕玲 +2 位作者 张玉 孙雪源 鲁明羽 《计算机科学与探索》 CSCD 北大核心 2024年第3期780-794,共15页
为提升命名实体识别(NER)模型的性能,可采用知识蒸馏方法,但是传统知识蒸馏损失函数因内部存在的耦合关系会导致蒸馏效果较差。为了解除耦合关系,有效提升输出层特征知识蒸馏的效果,提出一种结合k-best维特比解码的解耦合知识蒸馏方法(k... 为提升命名实体识别(NER)模型的性能,可采用知识蒸馏方法,但是传统知识蒸馏损失函数因内部存在的耦合关系会导致蒸馏效果较差。为了解除耦合关系,有效提升输出层特征知识蒸馏的效果,提出一种结合k-best维特比解码的解耦合知识蒸馏方法(kvDKD),该方法利用k-best维特比算法提高计算效率,能够有效提升模型性能。另外,基于深度学习的命名实体识别在数据增强时易引入噪声,因此提出了融合数据筛选和实体再平衡算法的数据增强方法,旨在减少因原数据集引入噪声和增强数据错误标注的问题,提高数据集质量,减少过度拟合。最后在上述方法的基础上,提出了一种新的命名实体识别模型NER-kvDKD。在MSRA、Resume、Weibo、CLUENER和CoNLL-2003数据集上的对比实验结果表明,该方法能够提高模型的泛化能力,同时也有效提高了学生模型性能。 展开更多
关键词 命名实体识别(NER) 知识蒸馏 k-best维特比解码 数据增强
下载PDF
融合外部知识和位置信息的中文命名实体识别
13
作者 李源 洛桑嘎登 蒋卫丽 《计算机工程与应用》 CSCD 北大核心 2024年第22期162-171,共10页
命名实体识别(named entity recognition,NER)是信息检索和自然语言处理领域重要且基础的任务。与英文不同,目前大部分的中文NER方法,都面临分词困扰、领域知识缺失的问题。针对以上问题,基于Lattice结构,提出一种结合知识图谱嵌入(know... 命名实体识别(named entity recognition,NER)是信息检索和自然语言处理领域重要且基础的任务。与英文不同,目前大部分的中文NER方法,都面临分词困扰、领域知识缺失的问题。针对以上问题,基于Lattice结构,提出一种结合知识图谱嵌入(knowledge graphs embedding,KGE)和带掩码位置信息的中文NER模型。Lattice语义信息的使用,为补充词粒度信息和解决分词问题奠定了结构基础。知识图谱嵌入的使用,为模型补充并定位了其所缺失的领域知识。而带掩码位置信息的使用,则较好地解决了由于知识图谱的引入而带来的知识噪声问题。所提出的方法在通用领域和垂直领域上均能取得较好的表现,在Weibo、Resume以及CCKS 2017上的F1值分别达到了74.01%、96.62%、94.95%。 展开更多
关键词 LATTICE 知识图谱嵌入 位置信息 中文命名实体识别
下载PDF
基于CiteSpace的国内命名实体识别技术的知识图谱分析
14
作者 李源 蔡忠祥 +1 位作者 李娜 黄子鸣 《现代信息科技》 2024年第15期124-128,133,共6页
命名实体识别(NER)是自然语言处理(NLP)领域的重要任务。量化梳理NER的文献进程,有助于未来NER乃至NLP技术的突破发展。目前已有大量学者对NER任务进行了综述回顾。但是这些基于传统文献计量学的回顾方式,既过于依赖专家经验,又无法直... 命名实体识别(NER)是自然语言处理(NLP)领域的重要任务。量化梳理NER的文献进程,有助于未来NER乃至NLP技术的突破发展。目前已有大量学者对NER任务进行了综述回顾。但是这些基于传统文献计量学的回顾方式,既过于依赖专家经验,又无法直观呈现知识变迁。因此,文章以知网中文核心文献为驱动,基于CiteSpace工具,对国内NER技术进行了知识图谱展示和数据挖掘分析。分析结果显示:以2016年为界,国内已形成基于数据驱动的两个快速发展期;“当地高校+省立实验室”的形式已成为国内机构合作的主流;“深度学习”“知识图谱”“实体识别”“信息抽取”“神经网络”和“词向量”是国内NER领域的研究热点;未来对NER的研究倾向于应用落地、数据增强和知识抽取。 展开更多
关键词 命名实体识别 CITESPACE 知识图谱 中国知网
下载PDF
基于知识蒸馏的多任务命名实体识别模型
15
作者 李军 胡俊勇 +1 位作者 陈微 李登实 《计算机仿真》 2024年第12期167-171,共5页
近年来,基于有监督学习模型的命名实体识别方法取得了迅速的发展。然而,将这些方法应用于专业技术领域,如电力客户问答系统,由于缺乏标准化和领域的特殊性、专业性,会导致命名实体边界模糊,从而降低常规大型实体识别模型的性能。为了解... 近年来,基于有监督学习模型的命名实体识别方法取得了迅速的发展。然而,将这些方法应用于专业技术领域,如电力客户问答系统,由于缺乏标准化和领域的特殊性、专业性,会导致命名实体边界模糊,从而降低常规大型实体识别模型的性能。为了解决上述问题,提出了一种基于知识蒸馏的多任务命名实体识别方法。方法采用Multi-TaskNet训练框架,针对数据集中的多种实体类型分别训练教师模型,通过知识蒸馏实现复杂教师模型到轻量学生模型的知识迁移。使得学生模型能够充分学习每个实体的语义信息,以及不同实体类型之间的差异和关联性。实验结果表明,在电力数据实体识别数据集上,上述方法能够显著提高常规指标,如准确率、召回率和F1值,分别提高了5.61%、2.35%和5.35%。此外,该方法还比较了不同学生模型的内存占用和采样率,对提高电力系统的智能化水平具有积极作用。 展开更多
关键词 命名实体识别 知识蒸馏 教师模型 学生模型 多任务
下载PDF
基于电子病历的实体识别和知识图谱构建的研究 被引量:30
16
作者 黄梦醒 李梦龙 韩惠蕊 《计算机应用研究》 CSCD 北大核心 2019年第12期3735-3739,共5页
针对中文电子病历中命名实体识别和实体关系抽取研究方法中存在的问题,提出了一种基于双向长短时记忆网络(bidirectional long short-term memory)与CRF(conditional random field)结合的实体识别和实体关系抽取方法。该方法首先使用词... 针对中文电子病历中命名实体识别和实体关系抽取研究方法中存在的问题,提出了一种基于双向长短时记忆网络(bidirectional long short-term memory)与CRF(conditional random field)结合的实体识别和实体关系抽取方法。该方法首先使用词嵌入技术将文本转换为数值向量,作为神经网络BiLSTM的输入,再结合CRF链式结构进行序列标注,输出最大概率序列,并对识别结果知识图谱化。实验证明,该方法对中文电子病历进行实体识别和实体关系抽取时的准确率、召回率、F值有明显的提升。实验结果满足临床中系统应用需求,对帮助研究构建临床决策支持系统、个性化医疗推荐服务有引导作用。 展开更多
关键词 实体识别 实体关系 长短时记忆网络 知识图谱
下载PDF
注入图情领域知识的命名实体识别模型 被引量:1
17
作者 王娟 王志红 曹树金 《图书馆论坛》 CSSCI 北大核心 2023年第7期15-25,共11页
命名实体分类和识别是自然语言处理中的关键任务,其识别效果将会影响许多下游任务的性能。文章基于现有知识图谱,提出图情领域九大类实体,构建适用于图情领域实体识别的LISERNIE+BiGRU+CRF模型。其中,LISERNIE模型的训练以ERNIE为基础,... 命名实体分类和识别是自然语言处理中的关键任务,其识别效果将会影响许多下游任务的性能。文章基于现有知识图谱,提出图情领域九大类实体,构建适用于图情领域实体识别的LISERNIE+BiGRU+CRF模型。其中,LISERNIE模型的训练以ERNIE为基础,增加了注入图情领域知识的预训练阶段训练。通过开展广泛的实验,发现LISERNIE+BiGRU+CRF模型能有效识别出命名实体,且在小规模标注数据集上具有明显的性能优势;当应用到后续的开放域关系抽取实验时,其准确率远高于CORE系统,可为进一步构建知识图谱、问答系统、机器阅读等提供模型和数据支撑。 展开更多
关键词 命名实体识别 知识图谱 预训练语言模型 领域知识
下载PDF
联合实体识别与关系预测的知识库问答 被引量:2
18
作者 刘月峰 张晨荣 《计算机工程与设计》 北大核心 2020年第11期3224-3228,共5页
针对简单问题的知识库问答中实体识别和关系检测这两个组件相互独立,且忽略了实体与关系之间的对应关系的问题,提出一种联合实体识别和关系预测的神经网络模型。采用CNN-BiLSTM-CRF识别问句中的实体,将CNN-BiLSTM提取的文本特征与问题... 针对简单问题的知识库问答中实体识别和关系检测这两个组件相互独立,且忽略了实体与关系之间的对应关系的问题,提出一种联合实体识别和关系预测的神经网络模型。采用CNN-BiLSTM-CRF识别问句中的实体,将CNN-BiLSTM提取的文本特征与问题的标签嵌入特征组合后进行关系预测,提高实体识别的F1值和关系预测的准确率。模型能够同时检测问题中的实体和关系,提高了训练的效率。为快速将问题中的主题实体链接到知识库中,采用n-grams模型与TF-IDF的相结合构建实体别名索引,建立路径索引进行答案的查找。在流行的SimpleQuestions数据集上分析并验证了所提方法的有效性。 展开更多
关键词 知识图谱 问答系统 联合模型 实体识别 关系预测
下载PDF
基于深度学习的算法知识实体识别与发现 被引量:7
19
作者 朱国进 沈盼宇 《智能计算机与应用》 2017年第1期17-21,共5页
随着互联网技术的快速发展,人类已经习惯于从网络上获取知识,然而伴随着网络资源爆炸式增长,网络资源内容多样,人们使用浏览器获取知识的方法却停滞不前,因此需要一种工具来帮助人们从网络中高效地获取和发现新知识。由于网络资源文本... 随着互联网技术的快速发展,人类已经习惯于从网络上获取知识,然而伴随着网络资源爆炸式增长,网络资源内容多样,人们使用浏览器获取知识的方法却停滞不前,因此需要一种工具来帮助人们从网络中高效地获取和发现新知识。由于网络资源文本并不是完全结构化的数据,还包括一些自由文本等复杂的无结构数据,这种文本信息虽然方便人们自由表达概念以及事件等,但是同时也为机器搜索、统计分析等制造了障碍。因此,为了在文本上更方便地进行知识分析和挖掘,本文提出一种基于深度学习的算法知识实体识别与发现的方法,应用于算法知识领域来解决上述问题。通过创建算法知识专家库[1],训练词向量,建立深度神经网络模型,从算法知识文本中识别和发现算法知识名称。实验结果表明,该深度神经网络模型识别算法知识的准确率高达98%,并有效发现了专家库以外的新知识点,实现了预期实验需求。 展开更多
关键词 知识实体 命名实体识别 深度学习 知识发现
下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计
20
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部