期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
A U-Shaped Network-Based Grid Tagging Model for Chinese Named Entity Recognition
1
作者 Yan Xiang Xuedong Zhao +3 位作者 Junjun Guo Zhiliang Shi Enbang Chen Xiaobo Zhang 《Computers, Materials & Continua》 SCIE EI 2024年第6期4149-4167,共19页
Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or d... Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or discontinuous CNER.However,a unified CNER is often needed in real-world scenarios.Recent studies have shown that grid tagging-based methods based on character-pair relationship classification hold great potential for achieving unified NER.Nevertheless,how to enrich Chinese character-pair grid representations and capture deeper dependencies between character pairs to improve entity recognition performance remains an unresolved challenge.In this study,we enhance the character-pair grid representation by incorporating both local and global information.Significantly,we introduce a new approach by considering the character-pair grid representation matrix as a specialized image,converting the classification of character-pair relationships into a pixel-level semantic segmentation task.We devise a U-shaped network to extract multi-scale and deeper semantic information from the grid image,allowing for a more comprehensive understanding of associative features between character pairs.This approach leads to improved accuracy in predicting their relationships,ultimately enhancing entity recognition performance.We conducted experiments on two public CNER datasets in the biomedical domain,namely CMeEE-V2 and Diakg.The results demonstrate the effectiveness of our approach,which achieves F1-score improvements of 7.29 percentage points and 1.64 percentage points compared to the current state-of-the-art(SOTA)models,respectively. 展开更多
关键词 Chinese named entity recognition character-pair relation classification grid tagging U-shaped segmentation network
下载PDF
融合知识图谱的影视视频标签分类算法研究
2
作者 蒋洪迅 张琳 孙彩虹 《计算机科学与探索》 CSCD 北大核心 2024年第1期161-174,共14页
鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类... 鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类算法。首先,使用了基于大规模通用数据训练的多模态预训练模型提取了视觉和文本的特征,训练了一个多任务的视频标签预测模型,得到视频的类型、题材和实体三级标签;通过在多任务学习网络中引入相似性任务提高分类模型训练的难度,使得同类样本特征更加紧密,且更好地表达样本差异。其次,对于最细粒度的实体标签,提出了一个局部注意力头扩展的实体纠错模型,引入外部知识图谱的共现信息对前置模型的预测结果做修正,得到更准确的实体标签预测结果。采集豆瓣的半结构化数据构建了影视知识图谱并对影视视频标签分类模型进行了实证研究。视频标签分类的实验结果表明,首先,基于多任务网络结构,在训练分类任务时加入交叉熵损失函数和相似性损失函数对模型进行共同约束优化了特征表达,在类型、题材、实体标签的Top-1分类准确率上分别提升了3.70%、3.35%和16.57%;其次,针对前置模型的困难样本提出的全局-局部注意力机制模型,在引入了知识图谱信息之后,实体标签的Top-1分类准确率从38.7%提升到45.6%。该研究是使用图片-文本对数据在多模态视频标签分类问题上新的尝试,为少量数据样本情况下的短视频标签分类提供了新的研究思路。 展开更多
关键词 知识图谱 视频标签分类 多模态内容理解 实体纠错
下载PDF
融合时序分类的科技领域实体增长预测研究
3
作者 陈果 陈智力 陈霜澜 《情报理论与实践》 北大核心 2024年第2期116-123,共8页
[目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实... [目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实体词频时间序列的增长模式,将实体分为可拟合、有趋势和无规律3种类别;其次,利用曲线拟合、局部加权回归方法抽取特征,构建特征向量,再用MLP模型实现了高精度的实体分类;最后,构建融合时序分类的集成模型与基线模型进行对比验证效果。[结果/结论]根据实验结果,验证显示集成预测模型相对于基线模型,误差减少了13%以上,进一步证实了预测结果在科学性和准确性方面的优势。综合考虑,所提出的融合时间序列分类的实体增长预测方案在可行性和应用价值方面具备潜力。 展开更多
关键词 时间序列分类 领域实体 实体增长预测 集成模型
下载PDF
基于跨度和边界探测的实体关系联合抽取模型
4
作者 廖涛 许锦涛 《湖北民族大学学报(自然科学版)》 CAS 2024年第2期178-184,共7页
针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundar... 针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundary detection,SBDM)。SBDM首先使用训练Transformer的双向编码器表征量(bidirectional encoder representations from Transformer,BERT)模型将文本转化为词向量,并融合了通过图卷积获取的句法依赖信息以形成文本的特征表示;接着通过局部信息和句子上下文信息去探测实体边界并进行标记,以减少非实体跨度;然后将实体边界标记形成的跨度序列进行实体识别;最后将局部上下文信息融合到1个跨度实体对中并使用sigmoid函数进行关系分类。实验表明,SBDM在SciERC(multi-task identification of entities,relations,and coreference for scientific knowledge graph construction)数据集、CoNLL04(the 2004 conference on natural language learning)数据集上的关系分类指标S F1分别达到52.86%、74.47%,取得了较好效果。SBDM用于关系分类任务中,能促进跨度分类方法在关系抽取上的研究。 展开更多
关键词 实体关系 联合抽取 句法依赖 跨度 实体边界 图卷积 关系分类
下载PDF
室内实景三维重建技术综述
5
作者 康志忠 杨俊涛 《时空信息学报》 2024年第1期1-10,共10页
构建语义丰富、几何精确且拓扑完备的室内三维模型是实景三维中国建设中一项富有挑战性的任务,在室内导航与位置服务、虚拟现实、智能家居等领域都有重要的应用价值。室内空间结构布局复杂、实体要素类型多样及杂乱遮挡等因素给室内实... 构建语义丰富、几何精确且拓扑完备的室内三维模型是实景三维中国建设中一项富有挑战性的任务,在室内导航与位置服务、虚拟现实、智能家居等领域都有重要的应用价值。室内空间结构布局复杂、实体要素类型多样及杂乱遮挡等因素给室内实景三维重建带来诸多挑战。近些年,室内实景三维重建受到广泛关注,然而关于现有方法的系统性总结仍较为欠缺。本文对室内实景三维重建最新技术的研究进展进行整理和归纳。首先,简要总结当前主流的室内空间三维数据采集手段;其次,从室内实景三维模型构建过程中涉及的关键环节出发,从实体要素语义识别和分类、实体要素几何模型生成、空间拓扑特征组织与表达方面对现有方法及其优缺点进行综述;最后,对室内实景三维重建相关研究现存的技术挑战进行分析总结,并对未来研究趋势进行展望。 展开更多
关键词 室内实景三维 数据配准 实体要素分类 空间拓扑模型 实体要素几何模型
下载PDF
MKE: 基于背景知识与多头选择的嵌套命名实体识别
6
作者 李政 涂刚 汪汉生 《中文信息学报》 CSCD 北大核心 2024年第4期86-98,107,共14页
目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型... 目前,在嵌套命名实体识别研究中,基于片段的方法将命名实体识别转化为分类问题,通过微调预训练模型,能够较好地识别嵌套实体,但仍存在领域知识缺乏和无法实现实体多分类的不足。该文提出基于知识嵌入的多头模型,用于解决这些问题。模型的改进包括:①引入领域背景知识,知识嵌入层以实体矩阵的形式,实现背景知识的无损嵌入;②将命名实体识别过程转化为多头选择过程,借助注意力打分模型,计算候选片段得分,最终在正确识别嵌套实体边界的同时实现实体多分类。实验结果表明,以实体矩阵方式实现的背景知识嵌入,可以有效提高识别准确率,在7个嵌套与非嵌套命名实体识别数据集上取得SOTA表现。 展开更多
关键词 嵌套命名实体识别 知识嵌入 多头选择 注意力 实体多分类
下载PDF
基于跨度解码的嵌套命名实体识别方法
7
作者 念永明 陈艳平 +1 位作者 秦永彬 黄瑞章 《计算机工程与应用》 CSCD 北大核心 2024年第1期174-181,共8页
跨度分类是嵌套命名实体识别常用的方法,但由于需要穷举并验证每一个跨度,存在高复杂度和数据不平衡的问题。并且,由于对每个跨度是单独进行预测,忽视了文本序列中存在的实体间的依赖关系。针对跨度分类方法存在的上述问题,提出了一种... 跨度分类是嵌套命名实体识别常用的方法,但由于需要穷举并验证每一个跨度,存在高复杂度和数据不平衡的问题。并且,由于对每个跨度是单独进行预测,忽视了文本序列中存在的实体间的依赖关系。针对跨度分类方法存在的上述问题,提出了一种基于跨度解码的嵌套命名实体识别方法。结合词性特征、字符特征、词特征以及上下文特征对文本进行编码,获取文本丰富的语义信息;识别可能的实体开始位置,在此基础上穷举可能的实体跨度,一定程度地减少潜在的实体跨度;使用基于注意力机制的解码器逐一对每个开始所对应的实体跨度的类型进行预测,解码过程中将已预测的实体信息进行传递,进而捕获和学习实体间的依赖关系。实验结果表明,跨度解码可以有效地改进跨度分类,所提出的方法在公共的英语嵌套实体数据集ACE2005和GENIA上的F1分数分别提高了0.45和0.14个百分点。 展开更多
关键词 嵌套命名实体识别 跨度分类 编解码 神经网络
下载PDF
利用类型语义表示进行标签降噪的细粒度实体分类
8
作者 席鹏弼 靳小龙 +1 位作者 白硕 程学旗 《高技术通讯》 CAS 北大核心 2024年第2期111-122,共12页
细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信... 细粒度实体分类(FET)任务的训练数据往往利用已有知识库中的知识通过远程监督方法进行生成,生成过程中不可避免地引入多余的噪音标签。现有考虑训练数据中噪音问题的工作通常只建模训练数据和标注类型的概率分布,对细粒度类型的语义信息学习不足,造成在标注了多个细粒度类型的训练数据上选择了与实体上下文不相关的类型进行模型的学习。本文提出一种利用细粒度类型的语义表示进行标签降噪的细粒度实体分类方法。首先利用训练数据中具有唯一细粒度类型路径的数据学习一部分细粒度类型的表示,进而结合细粒度类型间的关系信息学习其他细粒度类型的表示;其次在标注了细粒度类型的训练数据中选取与实体上下文的语义信息最相似的细粒度类型为目标类型,从数据集中选择Top-K个相似数据进行细粒度类型语义信息的聚合;最后在聚合信息上学习最终的细粒度实体分类模型。实验结果表明,该方法可以有效地从标注了细粒度类型的训练数据中选出与实体上下文的语义信息最相符的细粒度类型,达到提升细粒度实体分类准确率的效果。 展开更多
关键词 实体分类 细粒度类型 多标签降噪 多标签分类
下载PDF
融合多特征的骨签释文实体识别
9
作者 石雨梦 王慧琴 +2 位作者 王展 刘瑞 王可 《计算机系统应用》 2024年第9期38-47,共10页
构建适用于汉长安城骨签释文的命名实体识别模型,用来解决由于汉长安城骨签释文关键内容缺失,而导致无法对部分骨签释文进行分类的问题.本文将汉长安城骨签释文原始文本作为数据集,采用BIOE(begin,inside,outside,end)标注方法对释文实... 构建适用于汉长安城骨签释文的命名实体识别模型,用来解决由于汉长安城骨签释文关键内容缺失,而导致无法对部分骨签释文进行分类的问题.本文将汉长安城骨签释文原始文本作为数据集,采用BIOE(begin,inside,outside,end)标注方法对释文实体进行数据标注,并提出融合字结构特征、字词结构特征的多特征融合网络模型(multi-feature fusion network,MFFN).该模型不仅考虑了单个字符的结构特征,还融合了字与词的结构特征,以增强模型对骨签释文的理解能力.实验结果表明,MFFN模型能够更好地识别汉长安城骨签释文的命名实体,实现骨签释文分类,优于现有NER模型,为历史学家和研究人员提供更加丰富和准确的数据支持. 展开更多
关键词 骨签 实体识别 BIOE标注方法 多特征融合 释文分类
下载PDF
基于对span的预判断和多轮分类的实体关系抽取
10
作者 佟缘 姚念民 《计算机工程与科学》 CSCD 北大核心 2024年第5期916-928,共13页
针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块... 针对自然语言处理领域中的实体识别和关系抽取任务,提出一种对词元序列(Token Sequence,又称span)进行预测的模型Smrc。模型整体上利用BERT预训练模型作为编码器,另外包含实体预判断(Pej)、实体多轮分类(Emr)和关系多轮分类(Rmr)3个模块。Smrc模型通过Pej模块的初步判断及Emr模块的多轮实体分类来进行实体识别,再利用Rmr模块的多轮关系分类来判断实体对间的关系,进而完成关系抽取任务。在CoNLL04、SciERC和ADE 3个实验数据集上,Smrc模型的实体识别F1值分别达到89.67%,70.62%和89.56%,关系抽取F1值分别达到73.11%,51.03%和79.89%,相较之前在3个数据集上的最佳模型Spert,Smrc模型凭借实体预判断和实体及关系多轮分类,在2个子任务上其F1值分别提高了0.73%,0.29%,0.61%及1.64%,0.19%,1.05%,表明了该模型的有效性及其优势。 展开更多
关键词 对span的预判断 实体关系抽取 BERT预训练模型 多轮实体分类 多轮关系分类
下载PDF
面向矿井提升机的故障知识图谱构建与应用
11
作者 董晓辉 郭庭甫 +2 位作者 朱海江 党小超 李芬芳 《计算机工程与应用》 CSCD 北大核心 2024年第14期348-356,共9页
针对矿井提升机故障领域公开数据较少、故障知识难以被有效利用的问题,提出了一种矿井提升机故障知识图谱构建方法。该方法引入故障文本分类流程处理目标语料存在的信息冗余问题;利用词典嵌入BERT和BiLSTM-CRF结合进行实体识别,通过ERNI... 针对矿井提升机故障领域公开数据较少、故障知识难以被有效利用的问题,提出了一种矿井提升机故障知识图谱构建方法。该方法引入故障文本分类流程处理目标语料存在的信息冗余问题;利用词典嵌入BERT和BiLSTM-CRF结合进行实体识别,通过ERNIE进行实体关系抽取,并将抽取到的三元组存储在Neo4j图数据库中,在此基础上,实现了一个基于矿井提升机故障知识图谱的智能问答系统。该知识图谱能够较好地揭示矿井提升机故障间的复杂关联关系,实现相关故障的根因分析,为矿井提升机故障诊断提供支撑。 展开更多
关键词 矿井提升机 故障知识图谱 文本分类 实体识别 关系抽取
下载PDF
基于深度学习的消费者投诉信息提取仿真
12
作者 孙徕壹 董微 +1 位作者 李梦寒 张青川 《计算机仿真》 2024年第3期538-541,共4页
投诉平台的投诉信息中包含了许多消费者对产品及服务问题的反馈,快速、完整且准确地从消费者投诉信息中识别出问题的类别,并提取相关实体,可以为商家及时提升服务、提高用户满意度提供有效辅助。以黑猫投诉平台中的投诉数据作为数据基础... 投诉平台的投诉信息中包含了许多消费者对产品及服务问题的反馈,快速、完整且准确地从消费者投诉信息中识别出问题的类别,并提取相关实体,可以为商家及时提升服务、提高用户满意度提供有效辅助。以黑猫投诉平台中的投诉数据作为数据基础,采用pipeline的方法对实体-多标签进行抽取。构建了Bert-BiLstm模型,提取实体之间的多标签类型,同时建立了Bert-BiLstm-CRF模型对实体对进行抽取。实验结果表明,所提出的实体-多标签抽取模型具有较好的性能,与基准模型对比,F1-score评估指标提升了0.96%~3.22%。 展开更多
关键词 多标签分类 实体抽取 双向长短时记忆网络 条件随机场 投诉
下载PDF
基于深度学习的法人和其他组织国民经济行业分类标准化流程研究
13
作者 袁辉 赵捷 +2 位作者 侯博 李晟飞 韩雪 《中国标准化》 2024年第5期61-65,共5页
针对当前法人和其他组织在国民经济行业分类中存在效率及准确性不高的问题,提出一套基于BERT-LSTM-CNN国民经济行业数据自动分类标准化流程。首先,通过对统一代码数据进行质量评估和调整,确保输入数据的准确性。其次,使用训练完善的BERT... 针对当前法人和其他组织在国民经济行业分类中存在效率及准确性不高的问题,提出一套基于BERT-LSTM-CNN国民经济行业数据自动分类标准化流程。首先,通过对统一代码数据进行质量评估和调整,确保输入数据的准确性。其次,使用训练完善的BERT-LSTM-CNN混合模型实现特征抽取,并应用自注意力机制与迁移学习策略,有效地处理了行业分类的问题。这一标准化流程不仅为各行业用户提供了准确、及时、全面的国民经济行业分类信息,同时还为决策制定过程提供了坚实的数据支撑。 展开更多
关键词 法人和其他组织 国民经济行业分类 标准化流程 深度学习
下载PDF
基于旋转注意力的命名实体识别模型
14
作者 来小孟 魏嘉银 《电脑与电信》 2024年第1期21-25,共5页
针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中... 针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中计算输出概率,最后使用MLP层对输出进行分类。实验结果表明,本文提出的方法在CADEC、GENIA和CoNLL2003等标准英文数据集上均取得了较好的性能,验证其在命名实体识别任务中的有效性和可行性。 展开更多
关键词 命名实体识别 旋转注意力 词对关系 分类
下载PDF
Named Entity Recognition for Nepali Text Using Support Vector Machines 被引量:3
15
作者 Surya Bahadur Bam Tej Bahadur Shahi 《Intelligent Information Management》 2014年第2期21-29,共9页
Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest i... Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest in this field of research since the early 1990s. Named Entity Recognition has a vital role in different fields of natural language processing such as Machine Translation, Information Extraction, Question Answering System and various other fields. In this paper, Named Entity Recognition for Nepali text, based on the Support Vector Machine (SVM) is presented which is one of machine learning approaches for the classification task. A set of features are extracted from training data set. Accuracy and efficiency of SVM classifier are analyzed in three different sizes of training data set. Recognition systems are tested with ten datasets for Nepali text. The strength of this work is the efficient feature extraction and the comprehensive recognition techniques. The Support Vector Machine based Named Entity Recognition is limited to use a certain set of features and it uses a small dictionary which affects its performance. The learning performance of recognition system is observed. It is found that system can learn well from the small set of training data and increase the rate of learning on the increment of training size. 展开更多
关键词 Support VECTOR MACHINE Named entity Recognition MACHINE Learning classification Nepali LANGUAGE TEXT
下载PDF
基于MCA-BERT的数学文本分类方法 被引量:2
16
作者 杨先凤 龚睿 李自强 《计算机工程与设计》 北大核心 2023年第8期2312-2319,共8页
为尽可能地提高数学文本分类的效果,通过构建数学文本数据集并对该数据集进行分析,提出增强文本实体信息的多通道注意力机制-Transformers的双向编码器表示(MCA-BERT)模型。通过Word2vec词向量的平均池化获得句子级的实体信息,通过注意... 为尽可能地提高数学文本分类的效果,通过构建数学文本数据集并对该数据集进行分析,提出增强文本实体信息的多通道注意力机制-Transformers的双向编码器表示(MCA-BERT)模型。通过Word2vec词向量的平均池化获得句子级的实体信息,通过注意力机制给不同词赋予不同权重,获得词语级的实体信息,将两类实体信息与BERT输出的上下文信息拼接,通过Softmax层得到分类结果。该方法在数学文本数据集上的F1值相比BERT单通道的方法提高了2.1个百分点。实验结果说明,该方法能够有效增强文本实体信息,获得更好的分类效果。 展开更多
关键词 数学文本分类 实体信息 注意力机制 多通道 双向编码器表示 词向量 分类器
下载PDF
FCG-NNER:一种融合字形信息的中文嵌套命名实体识别方法
17
作者 陈鹏 马洪彬 +2 位作者 周佳伦 李琳宇 余肖生 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第12期222-231,共10页
基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题。而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳。为了解决这一问题,... 基于跨度的模型是嵌套命名实体识别的主要方法,其核心是将实体识别问题转化为跨度分类问题。而在中文数据集中,由于中文单词不具有明显的分割符号,导致语义和边界信息不明确,进而造成中文嵌套命名实体识别效果不佳。为了解决这一问题,提出了融合字形信息的基于跨度的中文嵌套命名实体识别算法——FCG-NNER,首先通过卷积神经网络获取汉字的字形信息,其次通过交叉Biaffine双仿射解码层实现原文信息与字形信息融合,然后通过对角融合CNN层获取不同跨度之间的局部相互作用,最后将交叉Biaffine双仿射解码层的输出与对角融合CNN层的输出相加后输入到全连接层中,得到最终的预测结果。采用2个具有代表性的中文嵌套NER数据集(CMeEE和CLUENER2020)用于实验验证。结果显示,FCG-NNER在CMeEE数据集中的精度为65.02%,召回率为67.93%,F1值达到0.664 4;在CLUENER2020数据集中的精度为79.45%,召回率为82.33%,F1值达到0.808 6,证明FCG-NNER算法的性能明显超过2个数据集的基线。 展开更多
关键词 中文嵌套命名实体识别 字形特征 跨度分类 特征融合
下载PDF
一个实体关系与事件抽取的通用模型
18
作者 杨红菊 靳新宇 《计算机工程》 CAS CSCD 北大核心 2023年第2期143-149,共7页
信息提取的目的是从自然语言文件中找到具体信息,现有研究在信息抽取的实体关系和事件抽取任务中仅解决事件论元重叠和实体关系重叠的问题,未考虑两个任务共有的角色重叠问题,导致抽取结果准确率降低。提出一个两阶段的通用模型用于完... 信息提取的目的是从自然语言文件中找到具体信息,现有研究在信息抽取的实体关系和事件抽取任务中仅解决事件论元重叠和实体关系重叠的问题,未考虑两个任务共有的角色重叠问题,导致抽取结果准确率降低。提出一个两阶段的通用模型用于完成实体关系抽取和事件抽取子任务。基于预训练语言模型RoBERTa的共享特征表示,分别对实体关系/事件类型和实体关系/事件论元进行预测。将传统抽取触发词任务转化为多标签抽取事件类型任务,利用多尺度神经网络进一步提取文本特征。在此基础上,通过抽取文本相关类型的事件论元,根据论元角色的重要性对损失函数重新加权,解决数据不平衡、实体关系抽取和事件抽取中共同存在论元角色重叠的问题。在千言数据集中事件抽取和关系抽取任务测试集上的实验验证了该模型的有效性,结果表明,该模型的F1值分别为83.1%和75.3%。 展开更多
关键词 事件抽取 实体关系抽取 角色重叠 RoBERTa模型 多标签分类
下载PDF
新型农业经营主体需求下的经管人才数字素养分类培育
19
作者 汪全报 《中州大学学报》 2023年第3期27-31,37,共6页
数字经济和乡村振兴背景下,新型农业经营主体需求下的经管人才数字素养提升对于乡村产业振兴、弥合乡村数字素养鸿沟和推动新型农业经营主体高质量创新发展至关重要。经管人才数字素养的分类培育是由新型农业经营主体的类型及其对人才... 数字经济和乡村振兴背景下,新型农业经营主体需求下的经管人才数字素养提升对于乡村产业振兴、弥合乡村数字素养鸿沟和推动新型农业经营主体高质量创新发展至关重要。经管人才数字素养的分类培育是由新型农业经营主体的类型及其对人才多元化的需求等诸多因素决定的。基于产教融合和人才分类培育的学理释义,建构经管人才分类培育的路径包括:加强分层培育设计、分类梳理数字素养培育内容、推动培育主体多元融合、分类提升师资数字素养。最后提出新型农业经营主体经管人才数字素养分类培育的总结与思考。 展开更多
关键词 新型农业经营主体 数字素养 分类培育
下载PDF
基于BERT-CNN编码特征融合的实体关系联合抽取方法
20
作者 丁建立 苏伟 《中国民航大学学报》 CAS 2023年第2期47-53,共7页
针对现有实体关系抽取模型结构复杂且抽取效果欠佳的问题,提出基于预训练的BERT(bidirectional encoder representation from transformers)与CNN(convolutional neural network)编码特征融合的实体关系联合抽取方法。首先,基于BERT-CN... 针对现有实体关系抽取模型结构复杂且抽取效果欠佳的问题,提出基于预训练的BERT(bidirectional encoder representation from transformers)与CNN(convolutional neural network)编码特征融合的实体关系联合抽取方法。首先,基于BERT-CNN编码的句子向量预测主语的首尾位置;其次,将预测的首尾位置索引句子中的特征向量作为预测主语的首尾向量,再将预测的主语首尾向量采用乘积方式进行特征融合得到主语向量;然后,将主语向量与句子向量以乘积方式融合得到新的句子编码向量,进而指导不同关系下宾语首尾位置的预测,得到实体关系三元组。为了验证模型效果,将本模型与其他类似算法模型在NYT与WebNLG公开数据集上进行对比实验,其准确率、召回率均优于对比模型且F1值分别达到92.75%与93.19%。 展开更多
关键词 BERT CNN 特征融合 二分类 实体关系联合抽取 实体关系三元组
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部