期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进BiRTE的渔业健康养殖标准复杂关系抽取
1
作者 宋奇书 于红 +4 位作者 乔诗晗 罗璇 李光宇 邵立铭 张思佳 《大连海洋大学学报》 CAS CSCD 北大核心 2024年第1期153-161,共9页
为解决渔业健康养殖标准文本关系抽取领域特定性强、语意复杂导致关系抽取准确率不高等问题,提出了基于改进BiRTE的渔业健康养殖标准复杂关系抽取方法,针对实体和语义关联建模,将RoBERTa作为编码器,采用全词掩码和动态掩码的方式增强词... 为解决渔业健康养殖标准文本关系抽取领域特定性强、语意复杂导致关系抽取准确率不高等问题,提出了基于改进BiRTE的渔业健康养殖标准复杂关系抽取方法,针对实体和语义关联建模,将RoBERTa作为编码器,采用全词掩码和动态掩码的方式增强词向量特征表示,并在此基础上融合了自注意力机制(Self-Attention, SelfATT)将实体特征与关系特征结合聚焦,加强实体抽取与关系预测的联系,从而提升渔业标准文本抽取的准确性。结果表明:本文提出的基于改进BiRTE的渔业健康养殖标准复杂关系抽取模型(RoBERTa-BiRTE-SelfATT)对渔业标准复杂关系抽取的准确率、召回率和F1值分别为95.9%、95.4%、95.7%,较BiRTE模型分别提升了4.2%、3.1%、3.8%。研究表明,本文提出的渔业健康养殖标准复杂关系抽取模型RoBERTa-BiRTE-SelfATT可以有效解决渔业标准文本关系抽取中专有名词识别不准确、语意复杂导致实体关系难以抽取的问题,是一种有效的渔业标准复杂关系抽取方法。 展开更多
关键词 渔业标准 关系抽取 重叠关系 复杂关系 自注意力机制
下载PDF
基于规则匹配与深度学习AbTransformer的渔业标准表格信息抽取方法
2
作者 孙哲涛 于红 +5 位作者 宋奇书 李光宇 邵立铭 杨惠宁 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2023年第1期140-148,共9页
为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模... 为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模板与BERT-BiLSTM-CRF模型进行信息抽取,对非规则类表格信息采用改进的Transformer进行抽取,即在位置编码模块中引入行位置编码,与特征向量拼接以获取表格行列位置。结果表明:本文中提出的AbTransformer模型相较于机器学习MLP模型,AUC值提升了1.46%,相较于TabTransformer模型,AUC值提高了1.18%;本文中提出的RBM-AbTransformer模型与AbTransformer模型相比,准确率、召回率和F1值分别提高了7.78%、4.19%和5.27%。研究表明,结合RBM与AbTransformer的渔业标准表格信息抽取方法,有效解决了表格结构多样、表头位置不固定的问题,提升了渔业标准表格信息抽取的整体效果。 展开更多
关键词 渔业标准 实体识别 表格信息抽取 深度学习 Transformer模型
下载PDF
基于多核卷积神经网络(BERT+Multi-CNN+CRF)的水产医学嵌套命名实体识别 被引量:6
3
作者 刘巨升 于红 +5 位作者 杨惠宁 邵立铭 宋奇书 李光宇 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2022年第3期524-530,共7页
为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transf... 为解决水产医学命名实体识别中存在的嵌套实体识别准确率不高的问题,提出一种基于多核卷积的命名实体识别模型(BERT+Multi-CNN+CRF),采用多核卷积神经网络提取嵌套实体特征,通过BERT(bidirectional encoder representations from transformers)方法对输入语料进行预训练,丰富嵌套实体位置向量信息,获得嵌套实体输入特征矩阵,将提取特征矩阵与输入特征矩阵融合,以增强嵌套实体的特征表示,并进行不同模型的对比试验。结果表明,本文中提出的BERT+Multi-CNN+CRF模型,在水产医学嵌套命名实体识别任务中的准确率、召回率和F1值分别为88.04%、88.92%和88.48%,与识别准确率较高的BERT+BiLSTM+ATT+CRF模型相比,分别提高了2.25%、3.23%和2.74%。研究表明,本文中提出的BERT+Multi-CNN+CRF模型可有效解决水产医学嵌套实体识别准确率不高的问题,是一种有效的水产医学嵌套命名实体识别方法。 展开更多
关键词 水产医学 BERT 嵌套命名实体识别 卷积神经网络 多卷积核
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部