期刊文献+
共找到464篇文章
< 1 2 24 >
每页显示 20 50 100
A Multi-level Disambiguation Framework for Gene Name Normalization 被引量:1
1
作者 SUN Cheng-Jie WANG Xiao-Long LIN Lei LIU Yuan-Chao 《自动化学报》 EI CSCD 北大核心 2009年第2期193-197,共5页
关键词 肾炎 基因 复杂系统 医学文本 数据挖掘
下载PDF
L-NAME对围生期仔鼠的毒性不良反应
2
作者 胡家奇 张又祥 +1 位作者 罗梅娟 黄婉仪 《广东医学》 CAS 2022年第2期179-182,共4页
目的研究N-硝基-左旋精氨酸甲酯(N-nitro-L-arginine methyl ester,L-NAME)对围生期仔鼠的毒性不良反应,为L-NAME建立动物模型寻找合适剂量提供理论依据。方法通过给孕鼠灌胃的方法使围生期仔鼠接受不同剂量L-NAME(分为低剂量组、中剂... 目的研究N-硝基-左旋精氨酸甲酯(N-nitro-L-arginine methyl ester,L-NAME)对围生期仔鼠的毒性不良反应,为L-NAME建立动物模型寻找合适剂量提供理论依据。方法通过给孕鼠灌胃的方法使围生期仔鼠接受不同剂量L-NAME(分为低剂量组、中剂量组、高剂量组)或生理盐水(对照组),观察仔鼠生长发育情况,统计孕鼠产仔数、仔鼠畸形情况、出生体重等。结果(1)低剂量组和中剂量组孕鼠的产仔数较对照组差异无统计学意义[(11.40±5.60)只、(8.00±3.22)只vs.(10.30±2.23)只,P=0.551、0.172],高剂量组产仔数较对照组显著降低,差异有统计学意义[(4.78±2.82)只vs.(10.30±2.23)只,P=0.001]。(2)低剂量组与中剂量组间畸形率差异无统计学意义(P>0.05),高剂量组畸形率显著高于中剂量组与低剂量组(P=0.000)。(3)各组间仔鼠出生体重差异无统计学意义(P>0.05)。结论(1)L-NAME会引起新生鼠产生先天肢体畸形,但不影响出生体重。(2)大剂量L-NAME会导致孕鼠产仔率降低,新生鼠先天畸形率增加。 展开更多
关键词 L-name 围生期仔鼠 毒不良反应 动物模型
下载PDF
基于RoBERTa-Span-Attack的标签指针网络军事命名实体识别 被引量:1
3
作者 罗兵 张显峰 +1 位作者 段立 陈琳 《海军工程大学学报》 CAS 北大核心 2024年第1期76-82,93,共8页
军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事... 军事领域文本中存在大量军事实体信息,准确识别这些信息是军事文本信息提取和构建军事知识图谱的基础性任务。首先,提出了一种基于RoBERTa预训练模型、跨度和对抗训练的标签指针网络的融合深度模型(RoBERTa-Span-Attack),用于中文军事命名实体识别;然后,采用了一种基于Span的标签指针网络,同时完成实体的起止位置和类别的识别任务;最后,在模型训练过程中加入对抗训练策略,通过添加一些扰动来生成对抗样本进行训练。在军事领域数据集上的实验结果表明:所提出的军事领域命名实体识别模型相较于BERT-CRF、BERT-Softmax和BERT-Span,在识别准确度上具有更优的效果。 展开更多
关键词 军事命名实体识别 预训练模型 跨度 标签指针网络 对抗训练
下载PDF
Topological naming mechanism in feature-based modelling 被引量:2
4
作者 Junjun Wu, Tongyang Wang, Xinfang Zhang and Ji zhou Computer Aided Design Center, HuaZhong Univ.of Sci.& Tech. Wu Han, China, 430074. (e_amil:rm039@mecad.hust.edu.cn) 《Computer Aided Drafting,Design and Manufacturing》 1997年第2期73-80,共0页
To unambiguously identify topological entities such as faces, edges and vertices is one of the key issues of feature_based modelling. This makes it possible to replay the modelling history when the solid model is re_e... To unambiguously identify topological entities such as faces, edges and vertices is one of the key issues of feature_based modelling. This makes it possible to replay the modelling history when the solid model is re_evaluated. This paper describes a naming mechanism in order to fully automate model generation in terms of the constructing history. The topological naming system(TNS),presented in this paper, assigns a persistent identification to every topological entity if necessary, thus automatically generates a design variant when the design object is re_evaluated. 展开更多
关键词 topological naming feature_based modelling entity identification
全文增补中
汽车故障知识图谱构建及应用研究 被引量:1
5
作者 李先旺 黄忠祥 +2 位作者 贺德强 刘赛虎 秦学敬 《科学技术与工程》 北大核心 2024年第4期1578-1587,共10页
知识图谱技术对汽车高效的故障诊断具有重要的意义,现有汽车故障知识图谱构建存在着实体识别模型效果不佳、无法解决嵌套实体等问题。针对上述问题,通过采用全词掩码的预训练语义模型、加入对抗训练和改进嵌套实体识别模型的方式提高实... 知识图谱技术对汽车高效的故障诊断具有重要的意义,现有汽车故障知识图谱构建存在着实体识别模型效果不佳、无法解决嵌套实体等问题。针对上述问题,通过采用全词掩码的预训练语义模型、加入对抗训练和改进嵌套实体识别模型的方式提高实体识别模型效果,提出了一种改进的嵌套实体识别模型。实验结果表明,所提模型F1值(F_(1))、精确率(P)和召回率(R)相比基线模型分别提高了3.56%、4.08%、3.05%,相比其他模型也有不同程度的提高,验证了所提模型对汽车维修领域实体识别具有显著效果。同时,基于构建的汽车故障知识图谱,实现了汽车故障知识智能问答原型系统,展示了知识图谱技术在汽车故障诊断与维护领域的应用前景。 展开更多
关键词 汽车维修 知识图谱 嵌套命名实体识别 预训练模型 对抗训练
下载PDF
基于深度学习的函数名一致性检查及推荐方法
6
作者 郑炜 唐辉 +1 位作者 陈翔 张永杰 《软件学报》 EI CSCD 北大核心 2024年第10期4604-4622,共19页
函数是大多数传统编程语言中聚合行为的最小命名单元,函数名的可读性对于程序员理解程序功能及不同模块之间的交互有着至关重要的作用,低质量的函数名会使开发人员感到困惑,增加代码中的坏味道,进而引发由API误用而导致的软件缺陷.为此... 函数是大多数传统编程语言中聚合行为的最小命名单元,函数名的可读性对于程序员理解程序功能及不同模块之间的交互有着至关重要的作用,低质量的函数名会使开发人员感到困惑,增加代码中的坏味道,进而引发由API误用而导致的软件缺陷.为此,提出一种基于深度学习的函数名一致性检查及推荐方法,该方法被命名为DMName.首先,对于给定的目标函数源码,分别构建其内部上下文、交互上下文、兄弟上下文和封闭上下文,合并后得到上下文信息标记序列,然后利用FastText词嵌入技术将标记序列转换为上下文表示向量序列,输入到seq2seq模型编码器中,引入Copy机制和Coverage机制分别解决OOV问题和重复解码问题,输出目标函数名预测结果的向量序列,借助双通道CNN分类器进行函数名的一致性判断,若不一致则根据向量空间相似度匹配直接映射获得推荐的函数名.实验结果表明,DMName方法在函数名一致性检查任务和函数名推荐任务中的F1值分别达到82.65%和73.31%,比目前最优的DeepName方法分别提高2.01%和2.96%.最后,在GitHub大规模开源项目lancia中对DMName方法进行验证,挖掘得到16个函数名不一致问题并进行合理的名称推荐,进一步证实DMName方法的有效性. 展开更多
关键词 函数名 一致性检查 名称推荐 深度学习 seq2seq模型
下载PDF
基于GIS模型构建器的同名矢量图层批量合并方法实现
7
作者 王元超 张钊 +1 位作者 陈展昭 颜梅春 《西北水电》 2024年第3期126-130,共5页
为解决常规的矢量同名图层合并方法效率低、容易遗漏等问题,利用ArcGIS模型构建器分别创建了基于迭代要素类、迭代字段值、迭代行选择3种迭代器的同名矢量图层合并模型,实现了批量准确地矢量图层合并。介绍了关键工具,阐述了模型的创建... 为解决常规的矢量同名图层合并方法效率低、容易遗漏等问题,利用ArcGIS模型构建器分别创建了基于迭代要素类、迭代字段值、迭代行选择3种迭代器的同名矢量图层合并模型,实现了批量准确地矢量图层合并。介绍了关键工具,阐述了模型的创建思路及方法。结果表明:指定图层的合并可使用任意批量合并工具,效率相当且高效;所有同名图层的合并使用“迭代行选择”的方法效率最高,较使用“迭代要素类”的方法效率提升32.7%,较使用“迭代字段值”的方法效率提升21.9%。迭代行选择的方法在一定程度上可替代迭代字段值。创建的模型便于移植与共享。 展开更多
关键词 同名图层 批量合并 模型构建器 迭代器
下载PDF
SPEAKING模型下北京地铁双语站名语言景观考察与研究
8
作者 李稳敏 胡锦钰 《外语教育研究》 2024年第1期33-38,共6页
基于SPEAKING模型,选取模型中SPN三个要素,对比2022版及2023版北京城市轨道交通线网图,深入分析北京地铁双语站名语言景观。研究发现,北京地铁双语站名语言景观表达与语言服务质量、语言权势、身份认同及意识形态相关,但存在不统一、不... 基于SPEAKING模型,选取模型中SPN三个要素,对比2022版及2023版北京城市轨道交通线网图,深入分析北京地铁双语站名语言景观。研究发现,北京地铁双语站名语言景观表达与语言服务质量、语言权势、身份认同及意识形态相关,但存在不统一、不规范等实际问题。文章从语言服务质量的提升和象征功能的体现两个方面对该问题提出针对性修改建议,以规范北京地铁双语站名语言景观表达,进而强化“风向标”引领,彰显“头雁效应”。 展开更多
关键词 SPEAKING模型 地铁站名 语言景观 语言服务
下载PDF
面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例
9
作者 刘思得 李东升 《现代情报》 CSSCI 北大核心 2024年第12期102-121,共20页
[目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧... [目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧化服务产生重要影响和价值,可有效识别信息中的人名、地名、组织机构、资源利用、服务特色和文化推广等实体,为知识组织、信息检索等提供支持。[方法/过程]本文利用命名实体识别技术分析高校图书馆智慧化服务系统的应用前景,通过构建高质量的高校图情语料库,提供高质量训练数据,以满足领域内特定的实体识别需求的准确性和适应性,为优化图书馆智慧服务系统提供基础。采用基于深度学习的ALBERT-BILSTM-CRF模型,用以验证命名实体识别任务的效果,将该模型应用于高校图书馆服务推荐和知识图谱的案例分析,并与现有的国内外主流大语言模型进行了效果比较。[结果/结论]结果表明,本文提出的方法有效地提高了高校图情领域命名实体识别的性能,有助于实现图书馆智慧化服务的推广与应用,同时也减少了资源浪费和训练成本。此外,本文还探讨了服务于图书馆领域大语言模型LibraryGPT的可能性,以便对未来高校图书馆智慧服务的推广和发展提供参考和借鉴。 展开更多
关键词 高校图书馆 智慧服务 命名实体识别 大语言模型
下载PDF
基于边界感知的工业设备故障命名实体识别方法
10
作者 葛卫京 刘晓丽 杜亚峰 《计算机应用与软件》 北大核心 2024年第6期237-242,249,共7页
命名实体识别在识别工业设备故障方面发挥关键作用,有助于故障预测、维护管理和智能决策。针对工业设备故障数据中存在的嵌套结构和长跨度问题,提出一种边界感知的实体识别方法。该方法通过边界感知精准定位实体跨距,并结合类别预测判... 命名实体识别在识别工业设备故障方面发挥关键作用,有助于故障预测、维护管理和智能决策。针对工业设备故障数据中存在的嵌套结构和长跨度问题,提出一种边界感知的实体识别方法。该方法通过边界感知精准定位实体跨距,并结合类别预测判断实体跨距的所属类别,以提高识别性能。此外,为解决标注数据的缺乏的问题,还构建面向工业设备故障的实体识别数据集。实验结果证明了该方法在工业设备故障实体识别方面的有效性,并为后续数据分析和知识图谱的构建提供了坚实基础。 展开更多
关键词 命名实体识别 预训练语言模型 工业设备 故障信息
下载PDF
RIB-NER:基于跨度的中文命名实体识别模型
11
作者 田红鹏 吴璟玮 《计算机工程与科学》 CSCD 北大核心 2024年第7期1311-1320,共10页
命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错... 命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错误分类。针对这个问题,提出基于跨度的命名实体识别模型RIB-NER。首先,以RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,以获得更多的上下文语义信息和词汇信息。其次,利用IDCNN的并行卷积核来增强词之间的位置信息,从而使词与词之间联系更加紧密。同时,在模型中融合BiLSTM网络来获取上下文信息。最后,采用双仿射模型对句子中的开始标记和结束标记评分,使用这些标记探索跨度。在MSRA和Weibo 2个语料库上的实验结果表明,RIB-NER能够较为准确地识别实体边界,并分别获得了95.11%和73.94%的F1值。与传统深度学习相比,有更好的识别效果。 展开更多
关键词 中文命名实体识别 双仿射模型 迭代膨胀卷积神经网络 预训练模型 跨度
下载PDF
社交媒体数据中水灾事件求助信息提取模型
12
作者 孙焕良 王思懿 +1 位作者 刘俊岭 许景科 《计算机应用》 CSCD 北大核心 2024年第8期2437-2445,共9页
由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题,使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此,结合形式概念分析(FCA)、词共现关系和上下文语义信息构建了水灾事件知识体系。利用... 由于社交媒体平台上所发布的非结构化信息存在数据不一致、重要程度不同等问题,使自动准确抽取所需信息并标注受灾级别成为一个有挑战性的工作。因此,结合形式概念分析(FCA)、词共现关系和上下文语义信息构建了水灾事件知识体系。利用所构建的知识体系,基于TencentPretrain框架对大规模语言预训练模型(LLM)进行指令微调,构建了ChatFlowFlood信息抽取模型,可以在少量人工标记情况下,准确自动抽取被困情况、紧缺物资等信息;在信息抽取模型的基础上,通过模糊层次分析法(FAHP)和CRITIC法(CRiteria Importance Through Intercriteria Correlation)主客观结合评定求助信息的救援优先级,帮助决策者理解灾情紧急程度。实验结果表明,在中文社交媒体数据上,与ChatFlow-7B模型相比,ChatFlowFlood模型的FBERT指标提升了73.09%。 展开更多
关键词 中文社交媒体 命名实体识别 大规模语言模型 指令微调 水灾事件
下载PDF
InstructGPT在命名实体识别任务中的表现和挑战 被引量:1
13
作者 孙瑜 颜航 +3 位作者 邱锡鹏 王定 牟小峰 黄萱菁 《中文信息学报》 CSCD 北大核心 2024年第1期74-85,共12页
当前,关于大规模语言模型,例如,InstructGPT的研究主要聚焦在自由形式生成任务上,而忽略了在结构化抽取任务上的探索。为了让未来的工作在结构化抽取任务上有一个全面的认知,该文在零样本和少样本设定下,全面分析了InstructGPT在基础的... 当前,关于大规模语言模型,例如,InstructGPT的研究主要聚焦在自由形式生成任务上,而忽略了在结构化抽取任务上的探索。为了让未来的工作在结构化抽取任务上有一个全面的认知,该文在零样本和少样本设定下,全面分析了InstructGPT在基础的结构化抽取任务,命名实体识别上的表现。为了让结论更加可靠,该文的实验同时包含了生物医学领域和通用领域的常规和嵌套数据集。实验结果表明,InstructGPT在零样本学习上的性能只能达到微调小规模语言模型的11%~56%,增加少量样本也最多只能提升至72%。为了探究InstructGPT在命名实体识别上表现性能不佳的原因,该文通过分析模型的输出,发现接近50%的句子都存在无效生成的问题。另外,由于无效生成会同时导致“虚假错误预测”和“虚假正确预测”,解决生成无效问题并不能保证性能的提升。此外,InstructGPT抽取嵌套实体的能力还是有待提高,抽取嵌套实体的比例也偏低。因此,用InstructGPT解决命名实体识别任务,除了要保证生成的有效性,还需要更加深入地研究才能找到行之有效的方法。 展开更多
关键词 大规模语言模型 命名实体识别 上下文学习 思维链
下载PDF
融合领域词典嵌入的航空不安全事件命名实体识别
14
作者 许雅玺 孟天宇 +1 位作者 王欣 刘炳南 《科学技术与工程》 北大核心 2024年第8期3284-3290,共7页
针对航空不安全事件领域命名实体识别任务,以航空安全信息周报为数据源,分析并构建航空不安全事件命名实体识别数据集和领域词典。为解决传统命名实体识别模型对于捕获领域实体边界性能较差的问题,基于BERT(bidirectional encoder repre... 针对航空不安全事件领域命名实体识别任务,以航空安全信息周报为数据源,分析并构建航空不安全事件命名实体识别数据集和领域词典。为解决传统命名实体识别模型对于捕获领域实体边界性能较差的问题,基于BERT(bidirectional encoder representations from transformers)预训练语言模型提出融合领域词典嵌入的领域语义信息增强的方法。在自建数据集上进行多次对比实验,结果表明:所提出的方法可以进一步提升实体边界的识别率,相较于传统的双向长短期记忆网络-条件随机场(bi-directional long short term memory-conditional random field,BiLSTM-CRF)命名实体识别模型,性能提升约5%。 展开更多
关键词 航空不安全事件 领域词典 命名实体识别 预训练语言模型
下载PDF
融合词信息和图注意力的医学命名实体识别 被引量:1
15
作者 赵珍珍 董彦如 +2 位作者 刘静 张俊忠 曹慧 《计算机工程与应用》 CSCD 北大核心 2024年第11期147-155,共9页
中文临床自然语言中富含大量的病历信息,对电子病历进行命名实体识别有助于建立医学辅助诊断系统,对医学领域的发展具有重要的意义,同时有利于下游任务如关系提取、建立知识图谱的实现。但中文电子病历存在中文分词困难、医学专业术语... 中文临床自然语言中富含大量的病历信息,对电子病历进行命名实体识别有助于建立医学辅助诊断系统,对医学领域的发展具有重要的意义,同时有利于下游任务如关系提取、建立知识图谱的实现。但中文电子病历存在中文分词困难、医学专业术语多、含有特殊表达方式的问题,易造成文本特征表达错误,于是提出基于增强词信息和图注意力的医学命名实体识别研究模型,通过增强局部特征和全局特征提高网络模型的性能。由于嵌入单一的字向量进行中文实体识别易忽略文本中词信息及语义,为此在字向量中嵌入与其高度关联的词向量,既增强文本表示,又避免分词错误的问题,并且在嵌入层中嵌入了学习医疗知识的MedBert模型,该模型能根据不同语境动态生成特征向量,有助于解决电子病历中一词多义及专业词汇的问题。同时,在编码层中添加图注意力模块增强模型学习文本上下文关系的能力和对医疗特殊语法的学习。在cEHRNER和cMedQANER数据集的实验上分别获得了86.38%和84.76%的F1值,与其他模型相比有较好的鲁棒性。 展开更多
关键词 图注意力 匹配词 命名实体识别 Bert模型
下载PDF
基于大语言模型的中医医案命名实体抽取研究 被引量:1
16
作者 李盼飞 杨小康 +1 位作者 白逸晨 李海燕 《中国中医药图书情报杂志》 2024年第2期108-113,共6页
人工智能时代赋予了海量中医医案更高的学术价值,但医案文本不规范、命名实体种类繁多,严重阻碍了医案的深入研究。本研究在回顾中医医案格式演变历程、分析医案结构要素、构建医案信息模型的基础上,研制了基于大语言模型医案实体抽取... 人工智能时代赋予了海量中医医案更高的学术价值,但医案文本不规范、命名实体种类繁多,严重阻碍了医案的深入研究。本研究在回顾中医医案格式演变历程、分析医案结构要素、构建医案信息模型的基础上,研制了基于大语言模型医案实体抽取的提示词,探索基于大语言模型的医案命名实体的自动化抽取过程,最终开发出医案文本结构化工具。本研究为中医医案结构化研究、大规模中医医案科学数据抽取探索了可行路径,为基于中医医案的人工智能研究提供数据基础。 展开更多
关键词 中医医案 大语言模型 命名实体抽取 医案信息模型 人工智能
下载PDF
面向医学领域的文本特征增强多任务学习模型
17
作者 郭瑞强 贾晓文 +1 位作者 杨世龙 魏谦强 《计算机科学》 CSCD 北大核心 2024年第S02期121-127,共7页
医学命名实体的识别和规范化是构建高质量医学知识图谱的基础。文中提出了一种基于文本特征增强的多任务学习模型,旨在解决现有模型中医学实体识别与规范化模型不能充分利用文本特征的问题。该模型添加词级、字符级特征和上下文语义信... 医学命名实体的识别和规范化是构建高质量医学知识图谱的基础。文中提出了一种基于文本特征增强的多任务学习模型,旨在解决现有模型中医学实体识别与规范化模型不能充分利用文本特征的问题。该模型添加词级、字符级特征和上下文语义信息来增强文本表示,再通过4个分级子任务,联合建模完成医学实体识别和规范化任务。实验表明,该模型能够学习实体识别和实体规范化这两个任务的共同特征,有效地提高学习的准确率。在NCBI和BC5CDR两个数据集上取得了较好的效果,在NER和NEN任务上的F1值分别为:91.09%,91.02%;92.05%,92%。 展开更多
关键词 医疗命名实体识别 实体规范化 多任务 特征增强 联合建模
下载PDF
因果关系表示增强的跨领域命名实体识别
18
作者 刘小明 曹梦远 +2 位作者 杨关 刘杰 王杭 《计算机工程与应用》 CSCD 北大核心 2024年第18期176-188,共13页
跨领域命名实体识别在现实应用中,尤其在目标领域数据稀缺的小样本场景中具有重要价值。然而,现有方法主要是通过特征表示或模型参数共享实现的跨领域实体能力迁移,未充分考虑由于样本选择偏差而引起的虚假相关性问题。为了解决跨领域... 跨领域命名实体识别在现实应用中,尤其在目标领域数据稀缺的小样本场景中具有重要价值。然而,现有方法主要是通过特征表示或模型参数共享实现的跨领域实体能力迁移,未充分考虑由于样本选择偏差而引起的虚假相关性问题。为了解决跨领域中的虚假相关性问题,提出一种因果关系表示增强的跨领域命名实体识别模型,将源域的语义特征表示与目标域的语义特征表示进行融合,生成一种增强的上下文语义特征表示。通过结构因果模型捕捉增强后的特征变量与标签之间的因果关系。在目标域中应用因果干预和反事实推断策略,提取存在的直接因果效应,从而进一步缓解特征与标签之间的虚假相关性问题。该方法在公共数据集上进行了实验,实验结果得到了显著提高。 展开更多
关键词 跨领域命名实体识别 迁移学习 因果关系 结构因果模型 语义特征表示
下载PDF
基于多任务学习的IT运维服务需求语义解析 被引量:1
19
作者 许明阳 刘振元 王承涛 《计算机集成制造系统》 EI CSCD 北大核心 2024年第2期673-683,共11页
IT运维服务的自动化水平影响着企业的运营效率,为实现基于无人坐席的智能服务台,提出一种IT运维服务需求语义解析方法,包括意图识别和命名实体识别两个任务。在Multi-BERT-BiLSTM-CRF(MBBC)基准模型之上,通过先验知识和外部资源将词性... IT运维服务的自动化水平影响着企业的运营效率,为实现基于无人坐席的智能服务台,提出一种IT运维服务需求语义解析方法,包括意图识别和命名实体识别两个任务。在Multi-BERT-BiLSTM-CRF(MBBC)基准模型之上,通过先验知识和外部资源将词性和实体词典特征融入编码层,增强模型对词法信息和领域知识的学习。对MBBC模型的参数共享方式进行改进,提出增强的MBBC模型模型,增强两个任务之间的信息共享能力。实验表明,与MBBC模型相比,融合词性与实体词典特征并采用增强的MBBC模型可以进一步提升两类任务的识别性能。 展开更多
关键词 IT运维服务 意图识别 命名实体识别 BERT模型 多任务学习
下载PDF
基于连续提示注入与指针网络的农业病害命名实体识别
20
作者 王春山 张宸硕 +3 位作者 吴华瑞 朱华吉 缪祎晟 张立杰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第6期254-261,共8页
针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comp... 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2933条文本语料,8个实体类型,共10414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。 展开更多
关键词 农业病害 命名实体识别 连续提示 指针网络 嵌套实体 预训练语言模型
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部