期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
铝硅合金实体关系抽取数据集的构建方法 被引量:3
1
作者 刘英莉 吴瑞刚 +1 位作者 么长慧 沈韬 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期245-253,共9页
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标... 针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集. 展开更多
关键词 数据集 构建标准 数据标注 实体关系联合抽取模型 自注意力机制
下载PDF
对比学习与图神经网络技术支持下信息抽取技术应用研究
2
作者 马翊铭 《软件》 2023年第9期139-141,共3页
信息抽取技术是大数据时代精准获得信息的关键技术。在网络时代背景下,信息抽取的实时性、准确性和实名性极为重要,因此,在信息抽取时,实现对多元信息的筛选分析非常关键。通过文献研究与实践分析可知,对比学习和图神经网络技术的应用,... 信息抽取技术是大数据时代精准获得信息的关键技术。在网络时代背景下,信息抽取的实时性、准确性和实名性极为重要,因此,在信息抽取时,实现对多元信息的筛选分析非常关键。通过文献研究与实践分析可知,对比学习和图神经网络技术的应用,有利于在信息抽取环节准确识别单词多义和单词缩写的信息,在实践中需分别构建模型,以便进一步实现信息抽取功能。 展开更多
关键词 对比学习 图神经网络 关系抽取模型
下载PDF
基于BERT-WWM预训练的跨文档三元组提取 被引量:2
3
作者 章振增 《计算机应用与软件》 北大核心 2023年第6期181-186,215,共7页
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通... 关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。 展开更多
关键词 跨文档三元组抽取 BERT Span规则 联合实体关系抽取模型
下载PDF
基于改进型深度学习算法的计算机数据分析
4
作者 边陆 林少波 +3 位作者 郭栋 代素敏 韩飞飞 程鹏 《微型电脑应用》 2023年第9期94-98,共5页
为了实现企业生产运营中大量数据的处理和分析,提出使用分布式文件系统和数据库完成大量数据的存储任务,根据用户需求使用批处理和流处理框架进行数据分析。在数据降维中采用非负矩阵分解的方法,将原始业务数据集映射到低维空间,并引入... 为了实现企业生产运营中大量数据的处理和分析,提出使用分布式文件系统和数据库完成大量数据的存储任务,根据用户需求使用批处理和流处理框架进行数据分析。在数据降维中采用非负矩阵分解的方法,将原始业务数据集映射到低维空间,并引入局部正则化保留数据的部分高维特征。基于深度学习算法建立关系抽取模型,采用BERT模型完成文本信息的实体抽取,编码器中加入前向反馈机制和多头注意力机制。实验表明,系统的分类精度最高达到0.97,算法模型提取出的正确样本条数最多可达到47个。 展开更多
关键词 数据分析 深度学习模型 流处理框架 数据降维 关系抽取模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部