期刊文献+
共找到1,265篇文章
< 1 2 64 >
每页显示 20 50 100
基于Prompt的两阶段澄清问题生成方法
1
作者 王培冰 张宁 张春 《计算机应用研究》 CSCD 北大核心 2024年第2期421-425,共5页
在自然语言相关系统中,当用户输入存在歧义时,生成澄清问题询问用户有助于系统理解用户需求;基于Prompt的方法可以更好地挖掘预训练语言模型的潜在知识,但往往需要手动设计模板,限制其生成澄清问题的多样性。为解决这一问题,提出了TSCQG... 在自然语言相关系统中,当用户输入存在歧义时,生成澄清问题询问用户有助于系统理解用户需求;基于Prompt的方法可以更好地挖掘预训练语言模型的潜在知识,但往往需要手动设计模板,限制其生成澄清问题的多样性。为解决这一问题,提出了TSCQG(two-stage clarification question generation)方法。首先,在动态Prompt模板生成阶段,利用歧义上下文和预训练语言模型生成动态的Prompt模板;然后在缺失信息生成阶段,将Prompt模板与外部知识相结合,充分利用预训练语言模型的生成能力生成相应的缺失信息。实验结果表明,在CLAQUA数据集的多轮对话情况中,BLEU值和ROUGE-L值分别达到了58.31和84.33,在ClariQ-FKw数据集上,BLEU值和ROUGE-L值分别达到了31.18和58.86。实验结果证明了TSCQG方法在澄清问题生成任务上的有效性。 展开更多
关键词 预训练语言模型 prompt 澄清问题生成 自然语言系统
下载PDF
文本分类中Prompt Learning方法研究综述 被引量:1
2
作者 顾勋勋 刘建平 +1 位作者 邢嘉璐 任海玉 《计算机工程与应用》 CSCD 北大核心 2024年第11期50-61,共12页
文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,... 文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,并且在文本分类领域取得了显著的进展。对以往的文本分类方法进行简要梳理,分析其存在的问题与不足;阐述了提示学习的发展进程,以及构建提示模板的方法,并对用于文本分类的提示学习方法研究及成果进行了介绍和总结。最后,对提示学习在文本分类领域的发展趋势和有待进一步研究的难点进行了总结和展望。 展开更多
关键词 提示学习 文本分类 情绪分析 新闻分类
下载PDF
基于prompt tuning的中文文本多领域情感分析研究
3
作者 赵文辉 吴晓鸰 +1 位作者 凌捷 HOON Heo 《计算机工程与科学》 CSCD 北大核心 2024年第1期179-190,共12页
不同领域的情感文本表达方式不一样,通常需要为各个领域训练相应的情感分析模型。针对无法用一个模型进行高效多领域情感分析的问题,提出了基于提示微调(prompt tuning)的多领域文本情感分析方法MSAPT。借助hard prompt,指示情感文本的... 不同领域的情感文本表达方式不一样,通常需要为各个领域训练相应的情感分析模型。针对无法用一个模型进行高效多领域情感分析的问题,提出了基于提示微调(prompt tuning)的多领域文本情感分析方法MSAPT。借助hard prompt,指示情感文本的所属领域和待选的情感标签,调动不同领域情感分析相关的知识,再为情感分析预训练一个统一的“通才模型”,在下游的各领域文本学习中,保持模型冻结,通过prompt tuning使模型学习到下游各领域情感文本的特征。MSAPT仅需保存一个模型和一些参数量远远小于模型的prompt,实现了多领域情感分析。在多个属于不同领域的情感文本数据集上进行实验,结果表明仅进行prompt tuning时,MSAPT效果优于模型微调(model tuning)的。最后,分别对适应特定领域的prompt tuning、hard prompt、soft prompt的长度和中间训练数据集的大小进行消融实验,从证明其对情感分析效果的影响。 展开更多
关键词 多领域情感分析 提示微调 预训练语言模型 T5
下载PDF
GUARDIAN: A Multi-Tiered Defense Architecture for Thwarting Prompt Injection Attacks on LLMs
4
作者 Parijat Rai Saumil Sood +1 位作者 Vijay K. Madisetti Arshdeep Bahga 《Journal of Software Engineering and Applications》 2024年第1期43-68,共26页
This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assist... This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assistance to simulate real threats. We introduce a comprehensive, multi-tiered defense framework named GUARDIAN (Guardrails for Upholding Ethics in Language Models) comprising a system prompt filter, pre-processing filter leveraging a toxic classifier and ethical prompt generator, and pre-display filter using the model itself for output screening. Extensive testing on Meta’s Llama-2 model demonstrates the capability to block 100% of attack prompts. The approach also auto-suggests safer prompt alternatives, thereby bolstering language model security. Quantitatively evaluated defense layers and an ethical substitution mechanism represent key innovations to counter sophisticated attacks. The integrated methodology not only fortifies smaller LLMs against emerging cyber threats but also guides the broader application of LLMs in a secure and ethical manner. 展开更多
关键词 Large Language Models (LLMs) Adversarial Attack prompt Injection Filter Defense Artificial Intelligence Machine Learning CYBERSECURITY
下载PDF
基于prompt和知识增强的方面级情感分析 被引量:1
5
作者 李阳 唐积强 +2 位作者 朱俊武 梁明轩 高翔 《计算机科学》 CSCD 北大核心 2023年第S01期67-73,共7页
方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt... 方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt被引入到方面级情感分析中,采用伪标签加方面词和意见词的方式创建prompt连续模板,并使用prompt-encoder训练伪标签使其拥有语义信息;然后,使用主题图注意力机制融合关于方面词和意见词的外部知识,根据融合外部知识的隐藏向量预测由情感词典组成的候选标签词;最后,采用求和置信度分数的方式将候选标签词的概率映射到情感极性分布空间上。实验表明,该模型在SemEval 2014任务的笔记本电脑数据集和餐厅数据集上将正确率分别提高了1.53%和3.5%。 展开更多
关键词 方面级情感分析 预训练语言模型 prompt 情感词典 知识增强 深度学习
下载PDF
融合多Prompt模板的零样本关系抽取模型
6
作者 许亮 张春 +1 位作者 张宁 田雪涛 《计算机应用》 CSCD 北大核心 2023年第12期3668-3675,共8页
Prompt范式被广泛应用于零样本的自然语言处理(NLP)任务中,但是现有基于Prompt范式的零样本关系抽取(RE)模型存在答案空间映射难构造与模板选择依赖人工的问题,无法取得较好的效果。针对这些问题,提出一种融合多Prompt模板的零样本RE模... Prompt范式被广泛应用于零样本的自然语言处理(NLP)任务中,但是现有基于Prompt范式的零样本关系抽取(RE)模型存在答案空间映射难构造与模板选择依赖人工的问题,无法取得较好的效果。针对这些问题,提出一种融合多Prompt模板的零样本RE模型。首先,将零样本RE任务定义为掩码语言模型(MLM)任务,舍弃答案空间映射的构造,将模板输出的词与关系描述文本在词向量空间中进行比较,以此判断关系类别;其次,引入待抽取关系类别的描述文本的词性作为特征,学习该特征与各个模板之间的权重;最后,利用该权重融合多个模板输出的结果,以此减少人工选取的Prompt模板引起的性能损失。在FewRel(Few-shot Relation extraction dataset)和TACRED(Text Analysis Conference Relation Extraction Dataset)这两个数据集上的实验结果显示,与目前最优的模型RelationPrompt相比,所提模型在不同数据资源设置下,F1值分别提升了1.48~19.84个百分点和15.27~15.75个百分点。可见,所提模型在零样本RE任务上取得了显著的效果提升。 展开更多
关键词 关系抽取 信息抽取 零样本学习 prompt范式 预训练语言模型
下载PDF
基于Prompt学习的无监督关系抽取模型
7
作者 黄梦林 段磊 +2 位作者 张袁昊 王培妍 李仁昊 《计算机应用》 CSCD 北大核心 2023年第7期2010-2016,共7页
无监督关系抽取旨在从无标签的自然语言文本中抽取实体之间的语义关系。目前,基于变分自编码器(VAE)架构的无监督关系抽取模型通过重构损失提供监督信号来训练模型,这为完成无监督关系抽取任务提供了新思路。针对此类模型无法有效地理... 无监督关系抽取旨在从无标签的自然语言文本中抽取实体之间的语义关系。目前,基于变分自编码器(VAE)架构的无监督关系抽取模型通过重构损失提供监督信号来训练模型,这为完成无监督关系抽取任务提供了新思路。针对此类模型无法有效地理解上下文信息、依赖数据集归纳偏置的问题,提出基于Prompt学习的无监督关系抽取(PURE)模型,其中包括关系抽取和链接预测两个模块。在关系抽取模块中设计了上下文感知的Prompt模板函数以融入上下文信息,并将无监督关系抽取任务转换为掩码预测任务,从而充分利用预训练阶段获得的知识完成关系抽取。在链接预测模块中则通过预测关系三元组中的缺失实体提供监督信号联合训练两个模块。在两个公开真实关系抽取数据集上进行了大量实验,得到的结果表明PURE模型能有效利用上下文信息并且不依赖数据集归纳偏置,相较于目前最优的基于VAE架构的模型UREVA(Variational Autoencoder-based Unsupervised Relation Extraction model)在NYT数据集上的B-cubed F1指标上提升了3.3个百分点。 展开更多
关键词 无监督关系抽取 prompt学习 变分自编码器 预训练语言模型 无监督学习
下载PDF
基于prompt的文本可读性评估
8
作者 冯宇涛 强继朋 +2 位作者 李云 袁运浩 朱毅 《扬州大学学报(自然科学版)》 CAS 北大核心 2023年第3期56-60,共5页
为了提高预训练模型在文本可读性分类中的表现,提出基于预训练模型BERT(bidirectional encoder representations from transformers)和GPT2(generative pre-training 2)的prompt文本可读性分类方法,通过手工模板和映射器将文本可读性分... 为了提高预训练模型在文本可读性分类中的表现,提出基于预训练模型BERT(bidirectional encoder representations from transformers)和GPT2(generative pre-training 2)的prompt文本可读性分类方法,通过手工模板和映射器将文本可读性分类转换为与模型预训练任务一致的文本填空形式,以此提高预训练模型的分类性能.实验表明,prompt方法在实验数据集上与传统机器学习和有监督的神经网络相比具有更好的分类性能. 展开更多
关键词 文本可读性分类 预训练模型 手工模板
下载PDF
基于Prompt和BERT的情感原因对抽取方法
9
作者 陈籽健 刘璐 +1 位作者 后琦 林宇亭 《信息技术与信息化》 2023年第8期42-46,共5页
情感原因对抽取是一项全新的自然语言处理任务,试图提取出文本中所有的情感子句以及相应的原因子句。现有的工作要么遵循多阶段方法,其中情感抽取、原因抽取及配对都是单独进行的;要么使用复杂的架构来解决其局限性,并且可解释性较低。... 情感原因对抽取是一项全新的自然语言处理任务,试图提取出文本中所有的情感子句以及相应的原因子句。现有的工作要么遵循多阶段方法,其中情感抽取、原因抽取及配对都是单独进行的;要么使用复杂的架构来解决其局限性,并且可解释性较低。针对这些问题,本文提出一种基于Prompt和BERT相结合的ECPE-Prompt模型。该模型以一种可解释性较强的两阶段方法将情感抽取和原因抽取链接起来,最后完成情感原因对抽取任务。实验结果表明,该模型的F1分数指标对比基线模型提高6%。 展开更多
关键词 情感原因对抽取 BERT prompt 两阶段 情感抽取 情感原因抽取
下载PDF
大语言模型在英语教学中的角色 被引量:1
10
作者 许家金 赵冲 《外语教育研究前沿》 北大核心 2024年第1期3-10,90,共9页
本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,... 本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,也可以是读写练习中的小组讨论成员。在语言测评专家角色中,模型分析用户提供的语言材料,并对相关语言表现进行评价。本文主要展示了如何利用提示工程在听、说、读、写、译教学中发挥大语言模型的三类角色作用。 展开更多
关键词 大语言模型 教学角色 英语教学 提示工程 人机协同
下载PDF
基于RoBERTa和T5的两阶段医学术语标准化
11
作者 周景 崔灿灿 +1 位作者 王梦迪 王泽敏 《计算机系统应用》 2024年第1期280-288,共9页
医学术语标准化作为消除实体歧义性的重要手段,被广泛应用于知识图谱的构建过程之中.针对医学领域涉及大量的专业术语和复杂的表述方式,传统匹配模型往往难以达到较高的准确率的问题,提出语义召回加精准排序的两阶段模型来提升医学术语... 医学术语标准化作为消除实体歧义性的重要手段,被广泛应用于知识图谱的构建过程之中.针对医学领域涉及大量的专业术语和复杂的表述方式,传统匹配模型往往难以达到较高的准确率的问题,提出语义召回加精准排序的两阶段模型来提升医学术语标准化效果.首先在语义召回阶段基于改进的有监督对比学习和RoBERTa-wwm提出语义表征模型CL-BERT,通过CL-BERT生成实体的语义表征向量,根据向量之间的余弦相似度进行召回并得到标准词候选集,其次在精准排序阶段使用T5结合prompt tuning构建语义精准匹配模型,并将FGM对抗训练应用到模型训练中,然后使用精准匹配模型对原词和标准词候选集分别进行精准排序得到最终标准词.采用ccks2019公开数据集进行实验,F1值达到了0.9206,实验结果表明所提出的两阶段模型具有较高的性能,为实现医学术语标准化提供了新思路. 展开更多
关键词 医学术语标准化 RoBERTa-wwm 对比学习 T5 prompt tuning 知识图谱
下载PDF
基于单片机和PID算法的温度智能控制系统设计 被引量:1
12
作者 祖一康 徐妙婧 《现代电子技术》 北大核心 2024年第8期83-89,共7页
为提高温度控制的智能化水平,设计一种智能温度控制系统。该系统以STC89C52单片机为控制器,采用PID算法控制温度,具有语音播报和手机远程控制等功能。采用DS18B20温度传感器采集环境温度;设计LCD12864显示电路实时显示当前温度、温度上... 为提高温度控制的智能化水平,设计一种智能温度控制系统。该系统以STC89C52单片机为控制器,采用PID算法控制温度,具有语音播报和手机远程控制等功能。采用DS18B20温度传感器采集环境温度;设计LCD12864显示电路实时显示当前温度、温度上下限以及温度状态;设计WT588D语音提醒电路,当测量温度小于下限或大于上限时发出语音提醒;设计按键电路实现温度上下限值的设定;设计蓝牙通信电路,与手机APP通信,实现远程控制;采用PID算法输出控制量,控制固态继电器驱动加热或降温装置,实现温度控制。其次,对温度控制系统的硬件和软件进行设计,并制作实物进行运行测试。实验结果表明,所设计的温度控制系统能够很好地实现温度控制,从而达到预期效果,且操作方便、成本低,具有较强的应用价值。 展开更多
关键词 温度控制系统 PID算法 STC89C52单片机 LCD12864显示电路 语音提示 蓝牙通信
下载PDF
中国先进研究堆瞬发γ元素成像技术研究
13
作者 金象春 姚永刚 +4 位作者 肖才锦 贺林峰 赵梁 孙凯 陈东风 《中国无机分析化学》 CAS 北大核心 2024年第6期809-815,共7页
无损分析样品内部的元素分布,对于材料、考古、地质科学等领域的研究具有重要意义。基于瞬发γ活化分析方法,结合中子照相技术,分析了模拟样品的结构和对称性,首次利用中国先进研究堆(CARR)水平孔道聚焦的微束中子束流,开展样品瞬发γ... 无损分析样品内部的元素分布,对于材料、考古、地质科学等领域的研究具有重要意义。基于瞬发γ活化分析方法,结合中子照相技术,分析了模拟样品的结构和对称性,首次利用中国先进研究堆(CARR)水平孔道聚焦的微束中子束流,开展样品瞬发γ扫描分析和材料内部元素分布研究。通过蒙特卡罗软件(MCNP)对样品元素分布实验模型进行分析,模拟结果获得了样品不同区域的铜、铁、铝元素分布,基本实现了元素空间分辨。MCNP计算结果表明在瞬发γ扫描分析中,优化准直几何参数和提高中子通量能进一步提高元素空间分辨和元素测量准确度。 展开更多
关键词 元素分布 瞬发γ活化分析 中子成像 微束中子 MCNP
下载PDF
基于连续提示注入与指针网络的农业病害命名实体识别
14
作者 王春山 张宸硕 +3 位作者 吴华瑞 朱华吉 缪祎晟 张立杰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第6期254-261,共8页
针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comp... 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2933条文本语料,8个实体类型,共10414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。 展开更多
关键词 农业病害 命名实体识别 连续提示 指针网络 嵌套实体 预训练语言模型
下载PDF
基于情感和认知协同的道德判断方法
15
作者 吴迪 赵妍妍 秦兵 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1193-1205,共13页
随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战... 随着大语言模型的迅速发展,大语言模型的安全性逐渐引起了研究者和公众的密切关注.为了防止大语言模型在与人类协作中对人类产生伤害,如何确保大语言模型在日常场景中的判断能与人类道德观念相符成为了一个重要问题.其中一个关键的挑战是,如何确保大语言模型在道德判断方面,能够像人类那样,针对不同的情境,灵活地调整或重新考虑预定的规则,从而使其判断与人类的道德观念保持一致.受心理学和认知科学中关于人类道德判断的情感和认知影响因素研究的启发,结合大语言模型在认知推理和情感分析能力上的优势,设计了一种模仿人类道德判断过程中情感判断和认知判断能力交互的方法,从而提升了大语言模型的道德判断表现.实验结果证明了所提方法在该任务上的有效性.总的来说,不仅为大语言模型的道德判断提供了一种创新的方法,也强调了心理学与认知科学理论在此领域的重要性,为未来的进一步研究奠定基础. 展开更多
关键词 道德判断 大语言模型安全 认知判断能力 情感判断能力 提示学习
下载PDF
面向AIGC的教育提示工程学习提示单设计及应用
16
作者 方海光 王显闯 +1 位作者 洪心 舒丽丽 《现代远距离教育》 2024年第2期62-70,共9页
在AIGC时代,如何合理运用大模型赋能课堂教学是目前应解决的关键问题。通过教育提示工程的理论指导设计学习提示单能够促进教育与大模型等新技术的有效融合。学习提示单是帮助中小学师生在课堂中合理适恰地运用大模型解决问题的一种学... 在AIGC时代,如何合理运用大模型赋能课堂教学是目前应解决的关键问题。通过教育提示工程的理论指导设计学习提示单能够促进教育与大模型等新技术的有效融合。学习提示单是帮助中小学师生在课堂中合理适恰地运用大模型解决问题的一种学习资源,旨在通过运用教育提示工程的理论针对教育领域的提示词进行设计,从而解决大模型在课堂中的合理有效运用问题。针对中小学师生使用大模型遇到的诸如如何引导学生正确使用大模型、如何把控大模型的内容质量、如何规避大模型使用的伦理风险以及如何提高学生的批判性思维等问题,设计了基于三轮对话的T|BO-LRQET-P&R(简称LRQET)模型、学习提示单以及大模型的课堂教学应用模式。通过教育提示工程的理论设计学习提示单以助力师生的教与学。 展开更多
关键词 AIGC 大模型 教育提示工程 学习提示单 课堂教学
下载PDF
提示对学习者自我生成教学过程和学习效果的作用
17
作者 王福兴 黄宇 +2 位作者 张洋 祝婉玲 冷晓雪 《心理学报》 CSCD 北大核心 2024年第4期469-481,共13页
研究主要探讨了自我生成教学中不同类型的提示对学习效果和学习感知的影响。实验1发现自我生成教学的学习效果好于重复学习。实验2对比了图片、文字、关键词三种提示和无提示的效果。结果发现图片和关键词提示具有更好的学习效果。实验... 研究主要探讨了自我生成教学中不同类型的提示对学习效果和学习感知的影响。实验1发现自我生成教学的学习效果好于重复学习。实验2对比了图片、文字、关键词三种提示和无提示的效果。结果发现图片和关键词提示具有更好的学习效果。实验3设置了关键词提示组、生成提示组和无提示组。结果发现关键词提示和生成提示的保持成绩好于无提示,生成提示的迁移成绩好于无提示。此外,关键词提示和生成提示可以促进学习者产生更多的概念单元。结论认为:(1)在自我生成教学时获得图片提示能促进知识保持,获得关键词提示能促进知识保持和迁移。(2)相比于被动获得提示,学习者主动生成提示更能促进知识迁移。(3)概念单元数量在提示影响学习效果中起中介作用。 展开更多
关键词 自我生成教学 提示 检索练习 关键词 生成性学习
下载PDF
基于提示学习混合模型的学术论文自动分类研究
18
作者 刘爱琴 贺玉斌 马茹茹 《数字图书馆论坛》 2024年第4期74-80,共7页
学术论文分类在知识管理、学术交流、研究导向和学术评估等方面都具有重要的意义。基于深度学习模型构建学术论文自动分类系统,相较于现有的文本分类方法,该系统融合提示学习思想,可较好地缩小预训练模型与下游任务的差距。结果表明,该... 学术论文分类在知识管理、学术交流、研究导向和学术评估等方面都具有重要的意义。基于深度学习模型构建学术论文自动分类系统,相较于现有的文本分类方法,该系统融合提示学习思想,可较好地缩小预训练模型与下游任务的差距。结果表明,该系统较好地提高了文本分类性能和规范性,为科研工作者提供了更好的管理、利用和挖掘信息的方式。 展开更多
关键词 学术论文 提示学习 自动分类
下载PDF
基于注意力机制和提示学习联合训练的上下位关系识别研究
19
作者 白宇 王新哲 《计算机科学》 CSCD 北大核心 2024年第S01期199-203,共5页
专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用。然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多... 专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用。然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多挑战。文中提出一种融合提示学习和注意力机制的术语上下位关系识别方法,该方法基于远程监督框架,将术语之间的最短依存路径作为辅助特征融入提示模板,使用图神经网络将术语间的共现信息融入提示学习和注意力机制联合训练过程。在专利文本测试数据集上的实验结果表明,所提方法的AUC值、F1值达到94.94%和89.33%,相较于PARE模型分别提升了3.82%和3.17%。该方法有效地去除了使用远程监督方法标注的数据集的噪声,避免了掩码语言模型的训练目标和下游任务的不匹配问题,充分利用了预训练语言模型中存在的语言知识信息。 展开更多
关键词 术语关系识别 远程监督 提示学习 注意力机制 上下位关系
下载PDF
增强提示学习的少样本文本分类方法
20
作者 李睿凡 魏志宇 +2 位作者 范元涛 叶书勤 张光卫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页
针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中... 针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 展开更多
关键词 预训练语言模型 少样本学习 文本分类 提示学习 三元组损失
下载PDF
上一页 1 2 64 下一页 到第
使用帮助 返回顶部