期刊文献+
共找到252篇文章
< 1 2 13 >
每页显示 20 50 100
Conditional Random Field Tracking Model Based on a Visual Long Short Term Memory Network 被引量:3
1
作者 Pei-Xin Liu Zhao-Sheng Zhu +1 位作者 Xiao-Feng Ye Xiao-Feng Li 《Journal of Electronic Science and Technology》 CAS CSCD 2020年第4期308-319,共12页
In dense pedestrian tracking,frequent object occlusions and close distances between objects cause difficulty when accurately estimating object trajectories.In this study,a conditional random field tracking model is es... In dense pedestrian tracking,frequent object occlusions and close distances between objects cause difficulty when accurately estimating object trajectories.In this study,a conditional random field tracking model is established by using a visual long short term memory network in the three-dimensional(3D)space and the motion estimations jointly performed on object trajectory segments.Object visual field information is added to the long short term memory network to improve the accuracy of the motion related object pair selection and motion estimation.To address the uncertainty of the length and interval of trajectory segments,a multimode long short term memory network is proposed for the object motion estimation.The tracking performance is evaluated using the PETS2009 dataset.The experimental results show that the proposed method achieves better performance than the tracking methods based on the independent motion estimation. 展开更多
关键词 Conditional random field(CRF) long short term memory network(LSTM) motion estimation multiple object tracking(MOT)
下载PDF
Short-and long-term behaviors of drifts in the Callovo-Oxfordian claystone at the Meuse/Haute-Marne Underground Research Laboratory 被引量:5
2
作者 G.Armand A.Noiret +1 位作者 J.Zghondi D.M.Seyedi 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2013年第3期221-230,共10页
Since 2000, the French National Radioactive Waste Management Agency (ANDRA) has been constructing an Underground Research Laboratory (URL) at Bure (east of the Paris Basin) to perform experiments in order to obt... Since 2000, the French National Radioactive Waste Management Agency (ANDRA) has been constructing an Underground Research Laboratory (URL) at Bure (east of the Paris Basin) to perform experiments in order to obtain in situ data necessary to demonstrate the feasibility of geological repository in the Callovo- Oxfordian claystone. An important experimental program is planned to characterize the response of the rock to different drift construction methods, Before 2008, at the main level of the laboratory, most of the drifts were excavated using pneumatic hammer and supported with rock bolts, sliding steel arches and fiber shotcrete. Other techniques, such as road header techniques, stiff and flexible supports, have also been used to characterize their impacts. The drift network is developed following the in situ major stresses. The parallel drifts are separated enough so as they can be considered independently when their hydromechanical (HM) behaviors are compared. Mine-by experiments have been performed to measure the HM response of the rock and the mechanical loading applied to the support system due to the digging and after excavation. Drifts exhibit extensional (mode I) and shear fractures (modes II and III) induced by excavation works. The extent of the induced fracture networks depends on the drift orientation versus the in situ stress field. This paper describes the drift convergence and deformation in the surrounding rock walls as function of time and the impact of different support methods on the rock mass behavior. An observation based method is finally applied to distinguish the instantaneous and time-dependent parts of the rock mass deformation around the drifts. 展开更多
关键词 field experiments Claystone Tunnel convergence Induced fractures short- and long-term behaviors
下载PDF
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:2
3
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
下载PDF
岩石破坏位移协调系数与GNSS数据的地震预测方法研究
4
作者 冯增朝 沈永星 赵阳升 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第11期4204-4219,共16页
本文以小尺度的岩石破坏试验为基础, 提出了以岩石表面多点位移信息预测岩石失稳破坏的短临前兆指标-位移协调系数(DCC).基于GNSS数据, 分析了DCC指标在大尺度地震中的演化特征, 提出了基于GNSS数据的DCC指标地震预测方法.研究结果表明:... 本文以小尺度的岩石破坏试验为基础, 提出了以岩石表面多点位移信息预测岩石失稳破坏的短临前兆指标-位移协调系数(DCC).基于GNSS数据, 分析了DCC指标在大尺度地震中的演化特征, 提出了基于GNSS数据的DCC指标地震预测方法.研究结果表明: 在岩石弹性承载阶段, DCC在较低水平波动;当承载达到岩石峰值强度95%~99%时, DCC出现突增是预测岩石失稳破坏的重要前兆指标.通过大量试验统计, 确定了岩石从弹性变形到塑性变形转变的岩石弹塑性临界阈值范围为0.98±0.2.当DCC大于弹塑性临界阈值时, 岩石即将发生失稳破坏.基于GNSS数据计算获取三个地震案例震前的DCC指标与岩石破坏过程中DCC指标的演化特征具有相似性, 当DCC指标达到弹塑性临界阈值后大地震将在3~16天发生, 验证了将DCC指标作为预测地震发生短临前兆的有效性.同时, 地震发生区域可以利用震前GNSS数据绝对变形场重构方法通过异常变形区进行确定, 且根据DCC达到阈值时刻的异常变形区面积与地震震级呈对数关系, 可估算地震震级.研究结果对基于GNSS数据建立和完善地震短临预测方法具有重要的意义. 展开更多
关键词 弹塑性阈值 GNSS连续观测 震前变形 绝对变形场 地震短临预测
下载PDF
基于命名实体识别的水电工程施工安全规范实体识别模型
5
作者 陈述 张超 +2 位作者 陈云 张光飞 李智 《中国安全科学学报》 CAS CSCD 北大核心 2024年第9期19-26,共8页
为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全... 为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全规范的命名实体识别模型;以《水利水电工程施工安全防护技术规范》(SL714—2015)为例,计算命名实体识别模型精确率。结果表明:BERT-BILSTM-CRF模型准确率为94.35%,相比于3种传统方法,准确率显著提高。研究成果有助于水电工程施工安全规范知识智能管理,为施工安全隐患智能判别提供支撑。 展开更多
关键词 命名实体识别 水电工程施工 安全规范 双向编码器表征法(BERT) 双向长短期记忆神经网络(BILSTM) 条件随机场(CRF)
下载PDF
基于多头注意力的中文电子病历命名实体识别 被引量:1
6
作者 肖丹 杨春明 +2 位作者 张晖 赵旭剑 李波 《计算机应用与软件》 北大核心 2024年第1期133-138,160,共7页
针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法。该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标... 针对中文电子病历中复杂医疗实体的识别问题,提出一种联合特征与多头注意力相结合的实体识别方法。该方法使用字符、词性和词典组成的联合特征,利用BiLSTM和多头注意力分别提取句子的全局特征和局部特征,利用CRF结合所有特征完成实体标签的预测。实验结果表明,该方法F1值达89.16%,其中治疗和疾病两类实体分别达到94.76%和95.56%。 展开更多
关键词 命名实体识别 中文电子病历 多头注意力 长短期记忆网络 条件随机场
下载PDF
面向采购文件的跨模态图片文本命名实体识别 被引量:1
7
作者 杨赛 刘昕 于绍文 《计算机工程与应用》 CSCD 北大核心 2024年第3期213-219,共7页
智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Ve... 智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Vector-Bi-LSTM-CRF),从图片文本中识别命名实体。该模型针对光学字符识别技术识别出的图片文本字符,定义连续文本字符边界,将边界内每个文本字符映射为向量,设计双向长短期记忆(Bi-LSTM)网络捕获边界内字符序列的上下文语义,计算字符状态分数矩阵,并通过条件随机场约束字符标记序列规则,获得全局最优标记序列。针对训练集计算命名实体预测误差,动态优化O2V2BLC模型的参数,实现命名实体识别。将该方法应用于采购文件资质类型等图片文本数据,能够有效识别图片中的投标单位、专家姓名、专业名称等命名实体,与条件随机场、隐马尔可夫算法、Bert-Bi-LSTM-CRF模型进行对比,显著提高了实体识别准确率,为智慧供应链的数智化采购提供支持。 展开更多
关键词 智慧供应链 命名实体识别 光学字符识别 双向长短期记忆网络 条件随机场
下载PDF
基于增强优化预训练语言模型的电力数据实体识别方法 被引量:1
8
作者 田雪涵 董坤 +1 位作者 赵剑锋 郭希瑞 《智慧电力》 北大核心 2024年第6期100-107,共8页
知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原... 知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原始数据集,采用增强优化预训练语言模型(RoBERTa)进行动态语义编码,利用双向长短期记忆网络(BiLSTM)和条件随机场(CRF)提取特征并优化标签。实验结果表明,该实体识别方法比传统基于深度学习的实体识别方法的平均数指标F1分数高2.17%,证实其对构建电力数据知识图谱的识别效果。 展开更多
关键词 知识图谱 实体识别 数据增强 预训练语言模型 双向长短期记忆网络 条件随机场
下载PDF
基于BERT的电子病历命名实体识别 被引量:2
9
作者 郑立瑞 肖晓霞 +2 位作者 邹北骥 刘彬 周展 《计算机与现代化》 2024年第1期87-91,共5页
电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技... 电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技术进行诊疗规律挖掘。为了高效识别电子病历中的命名实体,提出一种融合对抗训练(FGM)的基于BERT与双向长短期记忆网络(BILSTM)的命名实体识别方法(BERT-BILSTM-CRF-FGM,BBCF),对2017全国知识图谱与语义计算大会(CCKS2017)提供的中文电子病历语料做修正等预处理后,采用BBCF模型识别该语料中5种实体的平均F1值为92.84%,比基于膨胀卷积网络的BERT模型(BERT-IDCNN-CRF)和基于BILSTM的条件随机场模型(BILSTM-CRF)有更高的F1值和更快的收敛速度,能够更加高效地结构化电子病历文本。 展开更多
关键词 电子病历 命名实体识别 BERT FGM 双向长短期记忆网络 条件随机场
下载PDF
融合先验知识和字形特征的中文命名实体识别
10
作者 董永峰 白佳明 +1 位作者 王利琴 王旭 《计算机应用》 CSCD 北大核心 2024年第3期702-708,共7页
针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入... 针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入序列进行编码,并从中文维基百科中获取实体类型的中文释义,采用双向门控循环单元(BiGRU)编码实体类型信息作为先验知识,利用注意力机制将它与字符表示进行组合;其次,采用双向长短时记忆(BiLSTM)网络编码输入序列的远距离依赖关系,通过字形编码表获得繁体的仓颉码和简体的现代五笔码,采用卷积神经网络(CNN)提取字形特征表示,并根据不同权重组合繁体与简体字形特征,利用门控机制将它与经过BiLSTM编码后的字符表示进行组合;最后,使用条件随机场(CRF)解码,得到命名实体标注序列。在偏口语化的数据集Weibo、小型数据集Boson和大型数据集PeopleDaily上的实验结果表明,与基线模型MECT(Multi-metadata Embedding based Cross-Transformer)相比,所提模型的F1值别提高了2.47、1.20和0.98个百分点,验证了模型的有效性。 展开更多
关键词 命名实体识别 注意力机制 卷积神经网络 双向长短时记忆 条件随机场
下载PDF
基于深度学习的二进制变种协议字段划分方法
11
作者 安晓明 王忠勇 +3 位作者 翟慧鹏 巩克现 王玮 孙鹏 《计算机工程与设计》 北大核心 2024年第4期982-988,共7页
为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增... 为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增加协议字段列特征提取模块,搭建一种专门解决二进制变种协议字段格式划分的神经网络PRO-BILSTM-CRF。与二进制未知协议字段格式划分方法以及几种主流网络模型的对比实验结果表明,在变种协议字段格式划分任务上,提出模型能够取得更高准确率。 展开更多
关键词 二进制变种协议 深度学习 双向长短期记忆模型 条件随机场 特征提取 字段格式划分 协议逆向工程
下载PDF
面向图像数据的ConvNeXt特征提取研究
12
作者 杨鹏跃 王锋 魏巍 《计算机科学》 CSCD 北大核心 2024年第S01期283-289,共7页
卷积神经网络在计算机视觉任务中已取得诸多成果,无论是目标检测还是分割,都依赖于提取到的特征信息,一些模糊性的数据和物体形状各异等问题为特征提取带来了极大的挑战。传统的卷积结构只能学习到特征图相邻空间位置的上下文信息,无法... 卷积神经网络在计算机视觉任务中已取得诸多成果,无论是目标检测还是分割,都依赖于提取到的特征信息,一些模糊性的数据和物体形状各异等问题为特征提取带来了极大的挑战。传统的卷积结构只能学习到特征图相邻空间位置的上下文信息,无法对全局信息进行提取,而自注意力机制等模型虽具有更大的感受野和建立全局的依赖关系,但存在计算复杂度过高和需要大量数据等不足。为此,提出了一种CNN与LSTM结合的模型,该模型在增强局部感受野的前提下,可以更好地结合图像数据的全局信息。研究以主干网络ConvNeXt-T为基础模型,通过拼接不同大小卷积核以融合多尺度特征来解决物体形状各异的问题,并从水平和垂直两个方向聚合双向长短期记忆网络关注全局与局部信息的交互性。实验对公开访问的CIFAR-10,CIFAR-100,Tiny ImageNet数据集进行图像分类任务,所提出的网络在3个数据集实验中相较于基础模型ConvNeXt-T在准确率上分别提高了3.18%,2.91%,1.03%。实验证明改进后的ConvNeXt-T网络相较于基础模型在参数量和准确性方面都有了大幅度提升,可提取到更加有效的特征信息。 展开更多
关键词 特征提取 局部感受野 ConvNeXt-T 多尺度特征 双向长短期记忆网络
下载PDF
基于BioBERT与BiLSTM的临床试验纳排标准命名实体识别
13
作者 李盛青 苏前敏 黄继汉 《中国医学物理学杂志》 CSCD 2024年第1期125-132,共8页
目的:提出一种基于BioBERT预训练模型的纳排标准命名实体识别方法(BioBERT-Att-BiLSTM-CRF),可自动提取临床试验相关信息,为高效制定纳排标准提供帮助。方法:结合UMLS医学语义网络和专家定义方式,制定医学实体标注规则,并建立命名实体... 目的:提出一种基于BioBERT预训练模型的纳排标准命名实体识别方法(BioBERT-Att-BiLSTM-CRF),可自动提取临床试验相关信息,为高效制定纳排标准提供帮助。方法:结合UMLS医学语义网络和专家定义方式,制定医学实体标注规则,并建立命名实体识别语料库以明确实体识别任务。BioBERT-Att-BiLSTM-CRF首先将文本转换为BioBERT向量并输入至双向长短期记忆网络以捕捉上下文语义特征;同时运用注意力机制来提取关键特征;最终采用条件随机场解码并输出最优标签序列。结果:BioBERT-Att-BiLSTM-CRF在纳排标准命名实体识别数据集上的效果优于其他基准模型。结论:使用BioBERT-Att-BiLSTM-CRF能更高效地提取临床试验的纳排标准相关信息,从而增强临床试验注册数据的科学性,并为临床试验纳排标准的制定提供帮助。 展开更多
关键词 纳排标准 命名实体识别 双向长短期记忆网络 条件随机场 临床试验
下载PDF
面向机加工艺规程文本的实体识别模型
14
作者 董含笑 李豫虎 +1 位作者 乔立红 黄志成 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期313-320,共8页
为实现非结构化工艺规程文本中关键信息的高效识别,建立一种基于机加工领域词典和神经网络的命名实体识别模型.首先,结合机加工领域词典与jieba分词技术进行数据集的自动标注,并在对工艺参数信息进行标注的过程中将数字和标志字母划分... 为实现非结构化工艺规程文本中关键信息的高效识别,建立一种基于机加工领域词典和神经网络的命名实体识别模型.首先,结合机加工领域词典与jieba分词技术进行数据集的自动标注,并在对工艺参数信息进行标注的过程中将数字和标志字母划分为一个分词单位以增强后续特征提取效果;其次,在word2vec词嵌入的基础上,采用双向长短时记忆网络对文本进行特征提取;最后,采用条件随机场综合上下文逻辑以提高关键工艺信息的识别准确率.在包含431条工步内容的数据集上,对所提模型的识别效果进行实验,结果表明,所提模型的准确率、召回率和F1值分别为90.20%,93.88%和92.00%,在与领域内传统模型的对比上具有一定优势,并使用3个不同工艺规程数据集验证了该模型的鲁棒性. 展开更多
关键词 双向长短时记忆网络 条件随机场 命名实体识别 知识抽取
下载PDF
短时热处理对劣化交联聚乙烯热电性能影响 被引量:1
15
作者 惠宝军 谢月 《广东电力》 北大核心 2024年第2期88-94,共7页
热因素是影响高压电缆绝缘层交联聚乙烯绝缘微观形态的关键因素之一。选取1根运行7年与1根新电缆分别制备绝缘层交联聚乙烯片状试样,首先在105℃下进行180 d的热老化,然后在90~115℃对各老化试样进行恒温24 h的短时热处理,并完成交联度... 热因素是影响高压电缆绝缘层交联聚乙烯绝缘微观形态的关键因素之一。选取1根运行7年与1根新电缆分别制备绝缘层交联聚乙烯片状试样,首先在105℃下进行180 d的热老化,然后在90~115℃对各老化试样进行恒温24 h的短时热处理,并完成交联度、差示扫描量热、高场强电导测试。结果表明:老化初期,热老化助于交联聚乙烯结晶,且热处理有利于熔融温度与结晶度升高,晶体尺寸分布变小,电导率减小;随着热处理温度升高,上述参数逐渐到达最优值,并随热处理温度升高而开始反向变化;随着老化程度加深,相同热处理温度后各参数提升作用减弱,表现为参数最优值对应的热处理温度降低且与未老化试样差异逐渐减小,老化180 d后各参数值均明显低于未老化试样。研究表明,经历一定热老化的交联聚乙烯在合理温度下短时热处理后,可有效改善内部结晶特征,提升热电性能。 展开更多
关键词 高压电缆 交联聚乙烯 短时热处理 差示扫描量热 交联度 高场强电导
下载PDF
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别 被引量:5
16
作者 高国忠 李宇 +1 位作者 华远鹏 吴文旷 《长江大学学报(自然科学版)》 2024年第1期57-65,共9页
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from... 针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型。 展开更多
关键词 油气领域 命名实体识别 BERT 双向长短期记忆网络 条件随机场 BERT-BiLSTM-CRF模型
下载PDF
基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用
17
作者 彭彬 田宜平 +2 位作者 曾斌 吴雪超 吴文明 《地质科技通报》 CAS CSCD 北大核心 2024年第4期224-234,共11页
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立... 随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。 展开更多
关键词 地质实体识别 XLNET-BILSTM-Attention-CRF 磷矿成矿模式 预训练模型 序列标注
下载PDF
面向电子装备领域的标准数字化探索应用
18
作者 杜广涛 查珊珊 《空天预警研究学报》 CSCD 2024年第3期220-225,共6页
针对数字化转型过程中传统纸质或影印标准文件难以满足标准知识的实时性、准确性、关联性、对比性以及快速响应的获取需求,结合典型电子装备领域行业标准文件,采用TF-IDF和余弦相似度计算方法对标准文本进行词频统计及关联性分析,构建... 针对数字化转型过程中传统纸质或影印标准文件难以满足标准知识的实时性、准确性、关联性、对比性以及快速响应的获取需求,结合典型电子装备领域行业标准文件,采用TF-IDF和余弦相似度计算方法对标准文本进行词频统计及关联性分析,构建电子装备领域词表;然后利用基于规则和BERT-BiLSTM-CRF模型完成了分层知识抽取,采用Neo4j图数据库构建了电子装备领域知识图谱;最后设计了电子装备领域知识图谱应用系统架构、功能模块以及应用原型系统界面,为电子装备领域标准数字化的应用提供了解决方案和思路. 展开更多
关键词 电子装备 知识图谱 标准数字化 双向编码器表征法 双向长短时记忆网络 条件随机场
下载PDF
模式与深度学习融合抽取因果事件三元组
19
作者 黄俏娟 曹存根 陈志文 《高技术通讯》 CAS 北大核心 2024年第9期921-934,共14页
因果事件三元组对人们理解事件之间的逻辑联系至关重要。针对从文本中抽取因果事件三元组面临的缺乏高质量的数据集和因果知识覆盖范围有限的问题,本文提出了一种结合模式和深度学习的方法,从Web语料库中抽取因果事件三元组。首先,设计... 因果事件三元组对人们理解事件之间的逻辑联系至关重要。针对从文本中抽取因果事件三元组面临的缺乏高质量的数据集和因果知识覆盖范围有限的问题,本文提出了一种结合模式和深度学习的方法,从Web语料库中抽取因果事件三元组。首先,设计了反映因果关系的词法句法模式,并在Web语料库中进行匹配。其次,通过逆向文本频率和因果事件边界词策略,过滤模式匹配结果中的噪音。随后,采用规则的方法对因果事件进行规范化处理,形成了一个高质量的因果事件三元组数据集。最后,在双向长短期记忆-条件随机场(BiLSTM-CRF)模型中将字、词、词性、因果模式特征词和因果事件边界词进行了有效融合,并引入了深度学习策略。经过在因果事件三元组数据集上的训练,本文模型在抽取大规模且涵盖广泛领域知识的Web语料库的因果事件三元组任务中表现出色。实验结果表明,模型抽取因果事件三元组的F1值高达92.44%,边界词识别精确率达到94.00%。该结果证明了模式与深度学习的高效结合、构建数据集的高质量,以及该文模型在实际应用中对抽取Web语料库的因果事件三元组具有显著价值。 展开更多
关键词 因果事件三元组 词法句法模式 双向长短期记忆-条件随机场(BiLSTM-CRF) 多特征融合 深度学习
下载PDF
面向不平衡数据的机械设备故障命名实体识别
20
作者 党小超 刘涧 +2 位作者 董晓辉 祝忠彦 李芬芳 《计算机工程》 CAS CSCD 北大核心 2024年第9期104-112,共9页
命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在... 命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在这一领域效果欠佳,从而降低了知识图谱的质量。为应对上述问题,提出一种融合焦点损失(Focal Loss)函数和专业词典的实体识别方法。该方法使用Focal Loss函数应对实体类型不平衡问题,通过引入平衡因子和调制系数,改进传统的交叉熵损失函数,提升实体识别效果,同时将领域专业词汇嵌入到模型中,进一步提高实体识别性能,这一词典包含机械故障的领域术语,有助于模型更准确地识别机械设备故障命名实体。在自建的矿井提升机实验数据集上进行广泛实验验证,结果证明,融入Focal Loss后模型的F1值比主流模型BERT-BiLSTM-CRF提高了5.57个百分点,相比用于解决数据不平衡的典型方法SMOTE效果更优,在此基础上,通过嵌入领域词典,模型的F1值得到进一步提升,达到89.13%。 展开更多
关键词 命名实体识别 不平衡数据 焦点损失函数 机械设备故障 双向长短期记忆网络 条件随机场
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部