期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
RIB-NER:基于跨度的中文命名实体识别模型
1
作者 田红鹏 吴璟玮 《计算机工程与科学》 CSCD 北大核心 2024年第7期1311-1320,共10页
命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错... 命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错误分类。针对这个问题,提出基于跨度的命名实体识别模型RIB-NER。首先,以RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,以获得更多的上下文语义信息和词汇信息。其次,利用IDCNN的并行卷积核来增强词之间的位置信息,从而使词与词之间联系更加紧密。同时,在模型中融合BiLSTM网络来获取上下文信息。最后,采用双仿射模型对句子中的开始标记和结束标记评分,使用这些标记探索跨度。在MSRA和Weibo 2个语料库上的实验结果表明,RIB-NER能够较为准确地识别实体边界,并分别获得了95.11%和73.94%的F1值。与传统深度学习相比,有更好的识别效果。 展开更多
关键词 中文命名实体识别 双仿射模型 膨胀卷积神经网络 预训练模型 跨度
下载PDF
基于词嵌入的中文命名实体识别研究
2
作者 夏馨 王汝凉 李亚宁 《南宁师范大学学报(自然科学版)》 2024年第2期38-45,共8页
针对中文命名实体识别模型存在的语义信息不明和实体边界模糊的问题,该文提出一种基于深度学习的中文命名实体识别方法:先将预训练模型中提取的字符特征结合词典信息构成文本的词汇特征,再对特征信息进行提取并识别上下文语义特征及全... 针对中文命名实体识别模型存在的语义信息不明和实体边界模糊的问题,该文提出一种基于深度学习的中文命名实体识别方法:先将预训练模型中提取的字符特征结合词典信息构成文本的词汇特征,再对特征信息进行提取并识别上下文语义特征及全局语义特征,最后解码层输出实体识别的最优结果。在Resume数据集和Weibo数据集上进行实验的结果表明,该模型相较于经典的实体识别模型有更好的表现。 展开更多
关键词 命名实体识别 字词融合 双向门控循环单元 迭代膨胀卷积网络 多头自注意力机制
下载PDF
基于集成学习的中文命名实体识别方法 被引量:5
3
作者 梁兵涛 倪云峰 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期123-131,共9页
针对中文命名实体识别经典的BiLSTM-CRF(bi-directional long short-term memory-conditional random field)模型存在的嵌入向量无法表征多义词、编码层建模时注意力分散以及缺少对局部空间特征捕获的问题,本文提出一种融合BERT-BiGRU-M... 针对中文命名实体识别经典的BiLSTM-CRF(bi-directional long short-term memory-conditional random field)模型存在的嵌入向量无法表征多义词、编码层建模时注意力分散以及缺少对局部空间特征捕获的问题,本文提出一种融合BERT-BiGRU-MHA-CRF和BERT-IDCNN-CRF模型优势的集成模型完成命名实体识别.该方法利用裁剪的BERT模型得到包含上下文信息的语义向量;再将语义向量输入BiGRU-MHA(bi-directional gated recurrent unit-multi head attention)及IDCNN(Iterated Dilated Convolutional Neural Network)网络.前者捕获输入序列的时序特征并能够根据字符重要性分配权值,后者主要捕获输入的空间特征,利用平均集成方式将捕获到的特征融合;最后通过CRF层获得全局最优的标注序列.集成模型在人民日报和微软亚洲研究院(Microsoft research asia, MSRA)数据集上的F1值分别达到了96.09%和95.01%.相较于单个模型分别提高了0.74%和0.55%以上,验证了本文方法的有效性. 展开更多
关键词 命名实体识别 BERT模型 集成学习 注意力机制 迭代膨胀卷积网络
下载PDF
基于笔画ELMo嵌入IDCNN-CRF模型的企业风险领域实体抽取研究 被引量:2
4
作者 杨美芳 杨波 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第9期86-99,共14页
【目的】有效学习风险领域文本特征和上下文语义关联性,提升企业风险领域实体抽取的性能。【方法】提出基于笔画ELMo嵌入IDCNN-CRF的企业风险领域实体抽取模型。使用双向语言模型预训练大规模非结构化的企业风险领域数据得到的笔画ELMo... 【目的】有效学习风险领域文本特征和上下文语义关联性,提升企业风险领域实体抽取的性能。【方法】提出基于笔画ELMo嵌入IDCNN-CRF的企业风险领域实体抽取模型。使用双向语言模型预训练大规模非结构化的企业风险领域数据得到的笔画ELMo向量作为输入特征;将其送入IDCNN网络进行训练,运用CRF对IDCNN的输出层进行处理,获得全局最优的企业风险领域实体序列标注。【结果】模型对企业风险领域实体抽取的F值为91.9%,相对于BiLSTM-CRF模型的抽取性能提升了2.0%,且测试速度快2.36倍。【局限】未考虑本模型扩展于更多领域实体抽取任务的普适性。【结论】本文模型能够为企业风险领域实体语料库构建提供参考借鉴。 展开更多
关键词 笔画ELMo 膨胀卷积神经网络 条件随机场 实体抽取 风险领域实体
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部