期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于规则匹配与深度学习AbTransformer的渔业标准表格信息抽取方法
1
作者 孙哲涛 于红 +5 位作者 宋奇书 李光宇 邵立铭 杨惠宁 张思佳 孙华 《大连海洋大学学报》 CAS CSCD 北大核心 2023年第1期140-148,共9页
为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模... 为解决渔业标准文本中表格结构多样、表头位置不固定导致抽取效果不佳的问题,提出一种结合规则匹配(rule-based-matching,RBM)与AbTransformer(Absolute Transformer)深度学习模型的表格信息抽取方法,该方法对规则类表格信息采用规则模板与BERT-BiLSTM-CRF模型进行信息抽取,对非规则类表格信息采用改进的Transformer进行抽取,即在位置编码模块中引入行位置编码,与特征向量拼接以获取表格行列位置。结果表明:本文中提出的AbTransformer模型相较于机器学习MLP模型,AUC值提升了1.46%,相较于TabTransformer模型,AUC值提高了1.18%;本文中提出的RBM-AbTransformer模型与AbTransformer模型相比,准确率、召回率和F1值分别提高了7.78%、4.19%和5.27%。研究表明,结合RBM与AbTransformer的渔业标准表格信息抽取方法,有效解决了表格结构多样、表头位置不固定的问题,提升了渔业标准表格信息抽取的整体效果。 展开更多
关键词 渔业标准 实体识别 表格信息抽取 深度学习 Transformer模型
下载PDF
融合注意力机制与BERT+BiLSTM+CRF模型的渔业标准定量指标识别 被引量:18
2
作者 任媛 于红 +6 位作者 杨鹤 刘巨升 杨惠宁 孙哲涛 张思佳 刘明剑 孙华 《农业工程学报》 EI CAS CSCD 北大核心 2021年第10期135-141,共7页
在渔业标准文本中,定量指标识别对标准内容服务具有重要的意义,针对目前常用的命名实体识别方法对渔业标准定量指标识别准确率不高的问题,该研究提出了融合注意力机制与BERT+BiLSTM+CRF(Bidirectional Encoder Representations from Tra... 在渔业标准文本中,定量指标识别对标准内容服务具有重要的意义,针对目前常用的命名实体识别方法对渔业标准定量指标识别准确率不高的问题,该研究提出了融合注意力机制与BERT+BiLSTM+CRF(Bidirectional Encoder Representations from Transformers+Bi-directional Long Short-Term Memory+Conditional Random Field,来自转换器的双向编码器表征量+双向长短时记忆网络+条件随机场)模型的渔业标准定量指标识别方法,该方法将渔业标准中定量指标拆分为指标名、指标值、单位、限制词4类实体,通过分析渔业标准语料的特点发现位置信息对指标名等实体识别效果具有重要影响,首先利用BERT模型中位置向量信息提高指标名等实体的识别效果,其次采用BiLSTM(Bi-directional Long Short-Term Memory,双向长短时记忆网络)模型学习渔业标准文本定量指标中长序列语义特征,然后再将注意力机制与BERT+BiLSTM模型进行融合以解决长序列语义稀释问题,最后利用CRF(Conditional Random Field,条件随机场)层得到预测序列标签。试验结果表明,融合注意力机制与BERT+BiLSTM+CRF模型的渔业标准定量指标识别准确率为94.51%、召回率为96.37%、F1值为95.43%,研究表明,该方法解决了渔业标准定量指标识别准确率不高的问题,可以比较准确地识别由指标名、指标值、单位、限制词组成的渔业标准定量指标,是一种有效的渔业标准定量指标识别方法,可为农业、医学、生物等其他领域定量指标命名实体识别提供新思路。 展开更多
关键词 渔业 标准 模型 定量指标 BERT 注意力机制 BiLSTM 命名实体识别
下载PDF
基于双重注意力机制的渔业标准实体关系抽取 被引量:12
3
作者 杨鹤 于红 +6 位作者 孙哲涛 刘巨升 杨惠宁 张思佳 孙华 姜鑫 于英囡 《农业工程学报》 EI CAS CSCD 北大核心 2021年第14期204-212,共9页
针对渔业标准实体关系抽取任务中存在重叠关系导致的效果不好问题,提出了基于双重注意力机制的实体关系抽取方法。首先,提出了一种句式分类标注策略,以解决渔业标准文本中重叠关系难以标注的问题;其次,提出了结合双重注意力机制与BERT-B... 针对渔业标准实体关系抽取任务中存在重叠关系导致的效果不好问题,提出了基于双重注意力机制的实体关系抽取方法。首先,提出了一种句式分类标注策略,以解决渔业标准文本中重叠关系难以标注的问题;其次,提出了结合双重注意力机制与BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bi-directional Long Short-Term Memory-Conditional Random Field)的渔业标准实体关系抽取模型,分别利用字级别注意力机制和句子级别注意力机制优化权重分配、消除噪音,进而提高关系抽取的准确性;最后,为验证所提出方法的有效性设计了对比试验,结果表明,基于双重注意力机制的实体关系抽取方法在DLOU-FSI(Fishery Standard Interaction)数据集(36万字符)上准确率、召回率、F1值分别达到了92.67%、92.31%、92.49%。研究表明,该方法可有效解决渔业标准关系抽取任务中存在的重叠关系问题,提升了渔业标准实体关系抽取的整体效果,为构建渔业标准知识图谱提供参考。 展开更多
关键词 渔业 标准 模型 关系抽取 重叠关系 双重注意力机制 语料标注
下载PDF
面向知识图谱构建的水产动物疾病诊治命名实体识别 被引量:7
4
作者 刘巨升 杨惠宁 +5 位作者 孙哲涛 杨鹤 邵立铭 于红 张思佳 叶仕根 《农业工程学报》 EI CAS CSCD 北大核心 2022年第7期210-217,共8页
疾病诊治是水产动物健康养殖工程的重要支撑,知识图谱是水产动物疾病诊治知识表示及应用的有效手段,命名实体识别是构建水产动物疾病诊治知识图谱的关键。针对一词多义、实体嵌套等导致的水产动物疾病诊治命名实体识别准确率不高的问题... 疾病诊治是水产动物健康养殖工程的重要支撑,知识图谱是水产动物疾病诊治知识表示及应用的有效手段,命名实体识别是构建水产动物疾病诊治知识图谱的关键。针对一词多义、实体嵌套等导致的水产动物疾病诊治命名实体识别准确率不高的问题,该研究提出了融合BERT(Bidirectional Encoder Representations from Transformers)与CaBiLSTM (Cascade Bi-directional Long Short-Term Memory)的实体识别模型。首先,建立水产动物疾病诊治专用语料库,并利用语料库中的数据对设计的模型进行训练;其次,采用“分层思想”设计CaBiLSTM模型进行嵌套实体识别,用降维的内层实体特征提升外层实体的辨析度,并引入BERT模型增添实体位置信息;最后,为验证所提出方法的有效性进行对比试验。试验结果表明,提出的融合BERT与CaBiLSTM模型对水产动物疾病诊治命名实体识别准确率、召回率、F1值分别达到93.07%、92.85%、92.96%。研究表明,该模型能够有效解决水产动物疾病诊治命名实体识别过程中由于一词多义、实体嵌套等导致的识别准确率不高问题,可提高水产动物疾病诊治知识图谱的构建质量,促进水产健康养殖工程发展。 展开更多
关键词 模型 水产养殖 知识图谱 命名实体识别 嵌套实体 BERT BiLSTM
下载PDF
基于FMCW雷达的人体复杂动作识别 被引量:12
5
作者 丁晨旭 张远辉 +1 位作者 孙哲涛 刘康 《雷达科学与技术》 北大核心 2020年第6期584-590,共7页
针对利用摄像机进行人体动作识别时易受视距和光线影响等问题,提出一种基于FMCW雷达的人体复杂动作识别方案。首先基于FMCW信号模型对雷达采样数据采用一种以RDM(Range Doppler Map)向速度维投影的方式逐帧构建微多普勒谱图,继而基于微... 针对利用摄像机进行人体动作识别时易受视距和光线影响等问题,提出一种基于FMCW雷达的人体复杂动作识别方案。首先基于FMCW信号模型对雷达采样数据采用一种以RDM(Range Doppler Map)向速度维投影的方式逐帧构建微多普勒谱图,继而基于微多普勒谱图来提取用于表征整个动作频谱相关信息的8种特征矢量。最后,基于雷达实测数据,以贝叶斯超参数调整优化后的支持向量机作为分类器,分析利用所提取的单特征矢量以及特征矢量组合来进行分类时对分类准确率的影响,用以筛选最优异的特征矢量组合。实验结果表明,从微多普勒谱图中所提取的特征矢量皆可直观地表述整个动作过程的特性,且利用最终筛选得到的最优异的特征矢量组合对已知个体和未知个体的9种动作进行识别,识别准确率分别高达99.07%和96.76%。 展开更多
关键词 毫米波雷达 人体动作识别 微多普勒 特征提取 支持向量机
下载PDF
基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别 被引量:8
6
作者 杨鹤 于红 +5 位作者 刘巨升 杨惠宁 孙哲涛 程名 任媛 张思佳 《大连海洋大学学报》 CAS CSCD 北大核心 2021年第4期661-669,共9页
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替... 为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary,DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection,SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection,SPI)进行语料库的数据增广,首先构建“水产品名称”同类词词典和领域同义词词典,通过两个词典分别对“水产品名称”类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力。结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果。研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果。 展开更多
关键词 深度学习 实体识别 数据增广 BERT 双向长短时记忆网络 渔业标准
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部