期刊文献+
共找到1,345篇文章
< 1 2 68 >
每页显示 20 50 100
基于Prompt的两阶段澄清问题生成方法 被引量:4
1
作者 王培冰 张宁 张春 《计算机应用研究》 CSCD 北大核心 2024年第2期421-425,共5页
在自然语言相关系统中,当用户输入存在歧义时,生成澄清问题询问用户有助于系统理解用户需求;基于Prompt的方法可以更好地挖掘预训练语言模型的潜在知识,但往往需要手动设计模板,限制其生成澄清问题的多样性。为解决这一问题,提出了TSCQG... 在自然语言相关系统中,当用户输入存在歧义时,生成澄清问题询问用户有助于系统理解用户需求;基于Prompt的方法可以更好地挖掘预训练语言模型的潜在知识,但往往需要手动设计模板,限制其生成澄清问题的多样性。为解决这一问题,提出了TSCQG(two-stage clarification question generation)方法。首先,在动态Prompt模板生成阶段,利用歧义上下文和预训练语言模型生成动态的Prompt模板;然后在缺失信息生成阶段,将Prompt模板与外部知识相结合,充分利用预训练语言模型的生成能力生成相应的缺失信息。实验结果表明,在CLAQUA数据集的多轮对话情况中,BLEU值和ROUGE-L值分别达到了58.31和84.33,在ClariQ-FKw数据集上,BLEU值和ROUGE-L值分别达到了31.18和58.86。实验结果证明了TSCQG方法在澄清问题生成任务上的有效性。 展开更多
关键词 预训练语言模型 prompt 澄清问题生成 自然语言系统
下载PDF
文本分类中Prompt Learning方法研究综述 被引量:1
2
作者 顾勋勋 刘建平 +1 位作者 邢嘉璐 任海玉 《计算机工程与应用》 CSCD 北大核心 2024年第11期50-61,共12页
文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,... 文本分类是自然语言处理中的一项基础任务,在情感分析、新闻分类等领域具有重要应用。相较于传统的机器学习和深度学习模型,提示学习可以在数据不足的情况下通过构建提示来进行文本分类。近年来,GPT-3的出现推动了提示学习方法的发展,并且在文本分类领域取得了显著的进展。对以往的文本分类方法进行简要梳理,分析其存在的问题与不足;阐述了提示学习的发展进程,以及构建提示模板的方法,并对用于文本分类的提示学习方法研究及成果进行了介绍和总结。最后,对提示学习在文本分类领域的发展趋势和有待进一步研究的难点进行了总结和展望。 展开更多
关键词 提示学习 文本分类 情绪分析 新闻分类
下载PDF
基于prompt tuning的中文文本多领域情感分析研究
3
作者 赵文辉 吴晓鸰 +1 位作者 凌捷 HOON Heo 《计算机工程与科学》 CSCD 北大核心 2024年第1期179-190,共12页
不同领域的情感文本表达方式不一样,通常需要为各个领域训练相应的情感分析模型。针对无法用一个模型进行高效多领域情感分析的问题,提出了基于提示微调(prompt tuning)的多领域文本情感分析方法MSAPT。借助hard prompt,指示情感文本的... 不同领域的情感文本表达方式不一样,通常需要为各个领域训练相应的情感分析模型。针对无法用一个模型进行高效多领域情感分析的问题,提出了基于提示微调(prompt tuning)的多领域文本情感分析方法MSAPT。借助hard prompt,指示情感文本的所属领域和待选的情感标签,调动不同领域情感分析相关的知识,再为情感分析预训练一个统一的“通才模型”,在下游的各领域文本学习中,保持模型冻结,通过prompt tuning使模型学习到下游各领域情感文本的特征。MSAPT仅需保存一个模型和一些参数量远远小于模型的prompt,实现了多领域情感分析。在多个属于不同领域的情感文本数据集上进行实验,结果表明仅进行prompt tuning时,MSAPT效果优于模型微调(model tuning)的。最后,分别对适应特定领域的prompt tuning、hard prompt、soft prompt的长度和中间训练数据集的大小进行消融实验,从证明其对情感分析效果的影响。 展开更多
关键词 多领域情感分析 提示微调 预训练语言模型 T5
下载PDF
Prompt Engineering Importance and Applicability with Generative AI
4
作者 Prashant Bansal 《Journal of Computer and Communications》 2024年第10期14-23,共10页
Prompt engineering, the art of crafting effective prompts for artificial intelligence models, has emerged as a pivotal factor in determining the quality and usefulness of AI (Artificial Intelligence)-generated outputs... Prompt engineering, the art of crafting effective prompts for artificial intelligence models, has emerged as a pivotal factor in determining the quality and usefulness of AI (Artificial Intelligence)-generated outputs. This practice involves strategically designing and structuring prompts to guide AI models toward desired outcomes, ensuring that they generate relevant, informative, and accurate responses. The significance of prompt engineering cannot be overstated. Well-crafted prompts can significantly enhance the capabilities of AI models, enabling them to perform tasks that were once thought to be exclusively human domain. By providing clear and concise instructions, prompts can guide AI models to generate creative text, translate languages, write different kinds of creative content, and answer your questions in an informative way. Moreover, prompt engineering can help mitigate biases and ensure that AI models produce outputs that are fair, equitable, and inclusive. However, prompt engineering is not without its challenges. Crafting effective prompts requires a deep understanding of both the AI model’s capabilities and the specific task at hand. Additionally, the quality of the prompts can be influenced by factors such as the model’s training data [1] and the complexity of the task. As AI models continue to evolve, prompt engineering will likely become even more critical in unlocking their full potential. 展开更多
关键词 prompt Engineering AI ML prompt Zero Shot Few Shot Generative AI Chatbots AI Models
下载PDF
GUARDIAN: A Multi-Tiered Defense Architecture for Thwarting Prompt Injection Attacks on LLMs
5
作者 Parijat Rai Saumil Sood +1 位作者 Vijay K. Madisetti Arshdeep Bahga 《Journal of Software Engineering and Applications》 2024年第1期43-68,共26页
This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assist... This paper introduces a novel multi-tiered defense architecture to protect language models from adversarial prompt attacks. We construct adversarial prompts using strategies like role emulation and manipulative assistance to simulate real threats. We introduce a comprehensive, multi-tiered defense framework named GUARDIAN (Guardrails for Upholding Ethics in Language Models) comprising a system prompt filter, pre-processing filter leveraging a toxic classifier and ethical prompt generator, and pre-display filter using the model itself for output screening. Extensive testing on Meta’s Llama-2 model demonstrates the capability to block 100% of attack prompts. The approach also auto-suggests safer prompt alternatives, thereby bolstering language model security. Quantitatively evaluated defense layers and an ethical substitution mechanism represent key innovations to counter sophisticated attacks. The integrated methodology not only fortifies smaller LLMs against emerging cyber threats but also guides the broader application of LLMs in a secure and ethical manner. 展开更多
关键词 Large Language Models (LLMs) Adversarial Attack prompt Injection Filter Defense Artificial Intelligence Machine Learning CYBERSECURITY
下载PDF
基于prompt和知识增强的方面级情感分析 被引量:1
6
作者 李阳 唐积强 +2 位作者 朱俊武 梁明轩 高翔 《计算机科学》 CSCD 北大核心 2023年第S01期67-73,共7页
方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt... 方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt被引入到方面级情感分析中,采用伪标签加方面词和意见词的方式创建prompt连续模板,并使用prompt-encoder训练伪标签使其拥有语义信息;然后,使用主题图注意力机制融合关于方面词和意见词的外部知识,根据融合外部知识的隐藏向量预测由情感词典组成的候选标签词;最后,采用求和置信度分数的方式将候选标签词的概率映射到情感极性分布空间上。实验表明,该模型在SemEval 2014任务的笔记本电脑数据集和餐厅数据集上将正确率分别提高了1.53%和3.5%。 展开更多
关键词 方面级情感分析 预训练语言模型 prompt 情感词典 知识增强 深度学习
下载PDF
融合多Prompt模板的零样本关系抽取模型
7
作者 许亮 张春 +1 位作者 张宁 田雪涛 《计算机应用》 CSCD 北大核心 2023年第12期3668-3675,共8页
Prompt范式被广泛应用于零样本的自然语言处理(NLP)任务中,但是现有基于Prompt范式的零样本关系抽取(RE)模型存在答案空间映射难构造与模板选择依赖人工的问题,无法取得较好的效果。针对这些问题,提出一种融合多Prompt模板的零样本RE模... Prompt范式被广泛应用于零样本的自然语言处理(NLP)任务中,但是现有基于Prompt范式的零样本关系抽取(RE)模型存在答案空间映射难构造与模板选择依赖人工的问题,无法取得较好的效果。针对这些问题,提出一种融合多Prompt模板的零样本RE模型。首先,将零样本RE任务定义为掩码语言模型(MLM)任务,舍弃答案空间映射的构造,将模板输出的词与关系描述文本在词向量空间中进行比较,以此判断关系类别;其次,引入待抽取关系类别的描述文本的词性作为特征,学习该特征与各个模板之间的权重;最后,利用该权重融合多个模板输出的结果,以此减少人工选取的Prompt模板引起的性能损失。在FewRel(Few-shot Relation extraction dataset)和TACRED(Text Analysis Conference Relation Extraction Dataset)这两个数据集上的实验结果显示,与目前最优的模型RelationPrompt相比,所提模型在不同数据资源设置下,F1值分别提升了1.48~19.84个百分点和15.27~15.75个百分点。可见,所提模型在零样本RE任务上取得了显著的效果提升。 展开更多
关键词 关系抽取 信息抽取 零样本学习 prompt范式 预训练语言模型
下载PDF
基于Prompt学习的无监督关系抽取模型
8
作者 黄梦林 段磊 +2 位作者 张袁昊 王培妍 李仁昊 《计算机应用》 CSCD 北大核心 2023年第7期2010-2016,共7页
无监督关系抽取旨在从无标签的自然语言文本中抽取实体之间的语义关系。目前,基于变分自编码器(VAE)架构的无监督关系抽取模型通过重构损失提供监督信号来训练模型,这为完成无监督关系抽取任务提供了新思路。针对此类模型无法有效地理... 无监督关系抽取旨在从无标签的自然语言文本中抽取实体之间的语义关系。目前,基于变分自编码器(VAE)架构的无监督关系抽取模型通过重构损失提供监督信号来训练模型,这为完成无监督关系抽取任务提供了新思路。针对此类模型无法有效地理解上下文信息、依赖数据集归纳偏置的问题,提出基于Prompt学习的无监督关系抽取(PURE)模型,其中包括关系抽取和链接预测两个模块。在关系抽取模块中设计了上下文感知的Prompt模板函数以融入上下文信息,并将无监督关系抽取任务转换为掩码预测任务,从而充分利用预训练阶段获得的知识完成关系抽取。在链接预测模块中则通过预测关系三元组中的缺失实体提供监督信号联合训练两个模块。在两个公开真实关系抽取数据集上进行了大量实验,得到的结果表明PURE模型能有效利用上下文信息并且不依赖数据集归纳偏置,相较于目前最优的基于VAE架构的模型UREVA(Variational Autoencoder-based Unsupervised Relation Extraction model)在NYT数据集上的B-cubed F1指标上提升了3.3个百分点。 展开更多
关键词 无监督关系抽取 prompt学习 变分自编码器 预训练语言模型 无监督学习
下载PDF
基于prompt的文本可读性评估
9
作者 冯宇涛 强继朋 +2 位作者 李云 袁运浩 朱毅 《扬州大学学报(自然科学版)》 CAS 北大核心 2023年第3期56-60,共5页
为了提高预训练模型在文本可读性分类中的表现,提出基于预训练模型BERT(bidirectional encoder representations from transformers)和GPT2(generative pre-training 2)的prompt文本可读性分类方法,通过手工模板和映射器将文本可读性分... 为了提高预训练模型在文本可读性分类中的表现,提出基于预训练模型BERT(bidirectional encoder representations from transformers)和GPT2(generative pre-training 2)的prompt文本可读性分类方法,通过手工模板和映射器将文本可读性分类转换为与模型预训练任务一致的文本填空形式,以此提高预训练模型的分类性能.实验表明,prompt方法在实验数据集上与传统机器学习和有监督的神经网络相比具有更好的分类性能. 展开更多
关键词 文本可读性分类 预训练模型 手工模板
下载PDF
面向AIGC的教育提示工程学习提示单设计及应用 被引量:1
10
作者 方海光 王显闯 +1 位作者 洪心 舒丽丽 《现代远距离教育》 CSSCI 2024年第2期62-70,共9页
在AIGC时代,如何合理运用大模型赋能课堂教学是目前应解决的关键问题。通过教育提示工程的理论指导设计学习提示单能够促进教育与大模型等新技术的有效融合。学习提示单是帮助中小学师生在课堂中合理适恰地运用大模型解决问题的一种学... 在AIGC时代,如何合理运用大模型赋能课堂教学是目前应解决的关键问题。通过教育提示工程的理论指导设计学习提示单能够促进教育与大模型等新技术的有效融合。学习提示单是帮助中小学师生在课堂中合理适恰地运用大模型解决问题的一种学习资源,旨在通过运用教育提示工程的理论针对教育领域的提示词进行设计,从而解决大模型在课堂中的合理有效运用问题。针对中小学师生使用大模型遇到的诸如如何引导学生正确使用大模型、如何把控大模型的内容质量、如何规避大模型使用的伦理风险以及如何提高学生的批判性思维等问题,设计了基于三轮对话的T|BO-LRQET-P&R(简称LRQET)模型、学习提示单以及大模型的课堂教学应用模式。通过教育提示工程的理论设计学习提示单以助力师生的教与学。 展开更多
关键词 AIGC 大模型 教育提示工程 学习提示单 课堂教学
下载PDF
基于完形填空的方面级情感四元组预测
11
作者 彭文忠 夏家莉 +4 位作者 万齐智 刘德喜 万本庭 曹重华 夏池玉 《计算机学报》 EI CAS CSCD 北大核心 2024年第8期1744-1768,共25页
方面情感四元组预测(ASQP)任务旨在从给定的评论语句中提取所有方面词以及相应的方面类别、观点表达和情感极性,有助于全面了解用户对产品或服务不同方面的评价情况.现有情感四元组预测方法主要存在以下局限:(1)判别式模型没有利用promp... 方面情感四元组预测(ASQP)任务旨在从给定的评论语句中提取所有方面词以及相应的方面类别、观点表达和情感极性,有助于全面了解用户对产品或服务不同方面的评价情况.现有情感四元组预测方法主要存在以下局限:(1)判别式模型没有利用prompt捕获情感元素之间的语义关系;(2)生成式模型要么简单地将情感元素类型标签组合形成prompt,缺乏理解标签类型涵义的语境;要么将离散模板作为解码器的输入,而编码器则无法捕获到模板中情感元素之间的语义关系.为了缓解这些问题,本文首先基于完形填空思想研制离散和连续2类prompt,提供理解4个情感元素类型涵义的语境,帮助模型更好地捕获情感元素之间的语义关系;然后,基于设计的prompt,提出C-ASQP框架,包含判别式模型DC-ASQP和生成式模型GC-ASQP.在DC-ASQP中,采用2阶段策略,先预测4个情感元素中2个较为容易的情感元素,再将预测结果嵌入到设计的prompt中,帮助模型理解情感元素类型的涵义,从而有效预测另外2个情感元素.在GC-ASQP中,将设计的prompt作为编码器的输入,借助预训练模型的学习模式,充分利用预训练模型蕴含的知识提升四元组的生成效果.实验结果显示,DC-ASQP模型在4个常用数据集上的F1值相比同类判别式最优模型分别提高4.70%、6.48%、6.97%和2.60%,GC-ASQP模型的F1值比最优基准模型分别提高0.86%、1.67%、0.15%和1.02%,验证了将ASQP建模为完形填空任务的有效性,所设计的2类prompt以及C-ASQP框架是有效的. 展开更多
关键词 方面情感四元组预测 完形填空 离散和连续prompt 判别式和生成式模型 C-ASQP框架
下载PDF
大语言模型在英语教学中的角色 被引量:4
12
作者 许家金 赵冲 《外语教育研究前沿》 CSSCI 北大核心 2024年第1期3-10,90,共9页
本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,... 本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,也可以是读写练习中的小组讨论成员。在语言测评专家角色中,模型分析用户提供的语言材料,并对相关语言表现进行评价。本文主要展示了如何利用提示工程在听、说、读、写、译教学中发挥大语言模型的三类角色作用。 展开更多
关键词 大语言模型 教学角色 英语教学 提示工程 人机协同
下载PDF
基于单片机和PID算法的温度智能控制系统设计 被引量:5
13
作者 祖一康 徐妙婧 《现代电子技术》 北大核心 2024年第8期83-89,共7页
为提高温度控制的智能化水平,设计一种智能温度控制系统。该系统以STC89C52单片机为控制器,采用PID算法控制温度,具有语音播报和手机远程控制等功能。采用DS18B20温度传感器采集环境温度;设计LCD12864显示电路实时显示当前温度、温度上... 为提高温度控制的智能化水平,设计一种智能温度控制系统。该系统以STC89C52单片机为控制器,采用PID算法控制温度,具有语音播报和手机远程控制等功能。采用DS18B20温度传感器采集环境温度;设计LCD12864显示电路实时显示当前温度、温度上下限以及温度状态;设计WT588D语音提醒电路,当测量温度小于下限或大于上限时发出语音提醒;设计按键电路实现温度上下限值的设定;设计蓝牙通信电路,与手机APP通信,实现远程控制;采用PID算法输出控制量,控制固态继电器驱动加热或降温装置,实现温度控制。其次,对温度控制系统的硬件和软件进行设计,并制作实物进行运行测试。实验结果表明,所设计的温度控制系统能够很好地实现温度控制,从而达到预期效果,且操作方便、成本低,具有较强的应用价值。 展开更多
关键词 温度控制系统 PID算法 STC89C52单片机 LCD12864显示电路 语音提示 蓝牙通信
下载PDF
增强提示学习的少样本文本分类方法 被引量:2
14
作者 李睿凡 魏志宇 +2 位作者 范元涛 叶书勤 张光卫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页
针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中... 针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 展开更多
关键词 预训练语言模型 少样本学习 文本分类 提示学习 三元组损失
下载PDF
基于Prompt和BERT的情感原因对抽取方法
15
作者 陈籽健 刘璐 +1 位作者 后琦 林宇亭 《信息技术与信息化》 2023年第8期42-46,共5页
情感原因对抽取是一项全新的自然语言处理任务,试图提取出文本中所有的情感子句以及相应的原因子句。现有的工作要么遵循多阶段方法,其中情感抽取、原因抽取及配对都是单独进行的;要么使用复杂的架构来解决其局限性,并且可解释性较低。... 情感原因对抽取是一项全新的自然语言处理任务,试图提取出文本中所有的情感子句以及相应的原因子句。现有的工作要么遵循多阶段方法,其中情感抽取、原因抽取及配对都是单独进行的;要么使用复杂的架构来解决其局限性,并且可解释性较低。针对这些问题,本文提出一种基于Prompt和BERT相结合的ECPE-Prompt模型。该模型以一种可解释性较强的两阶段方法将情感抽取和原因抽取链接起来,最后完成情感原因对抽取任务。实验结果表明,该模型的F1分数指标对比基线模型提高6%。 展开更多
关键词 情感原因对抽取 BERT prompt 两阶段 情感抽取 情感原因抽取
下载PDF
基于RoBERTa和T5的两阶段医学术语标准化
16
作者 周景 崔灿灿 +1 位作者 王梦迪 王泽敏 《计算机系统应用》 2024年第1期280-288,共9页
医学术语标准化作为消除实体歧义性的重要手段,被广泛应用于知识图谱的构建过程之中.针对医学领域涉及大量的专业术语和复杂的表述方式,传统匹配模型往往难以达到较高的准确率的问题,提出语义召回加精准排序的两阶段模型来提升医学术语... 医学术语标准化作为消除实体歧义性的重要手段,被广泛应用于知识图谱的构建过程之中.针对医学领域涉及大量的专业术语和复杂的表述方式,传统匹配模型往往难以达到较高的准确率的问题,提出语义召回加精准排序的两阶段模型来提升医学术语标准化效果.首先在语义召回阶段基于改进的有监督对比学习和RoBERTa-wwm提出语义表征模型CL-BERT,通过CL-BERT生成实体的语义表征向量,根据向量之间的余弦相似度进行召回并得到标准词候选集,其次在精准排序阶段使用T5结合prompt tuning构建语义精准匹配模型,并将FGM对抗训练应用到模型训练中,然后使用精准匹配模型对原词和标准词候选集分别进行精准排序得到最终标准词.采用ccks2019公开数据集进行实验,F1值达到了0.9206,实验结果表明所提出的两阶段模型具有较高的性能,为实现医学术语标准化提供了新思路. 展开更多
关键词 医学术语标准化 RoBERTa-wwm 对比学习 T5 prompt tuning 知识图谱
下载PDF
中国先进研究堆瞬发γ元素成像技术研究
17
作者 金象春 姚永刚 +4 位作者 肖才锦 贺林峰 赵梁 孙凯 陈东风 《中国无机分析化学》 CAS 北大核心 2024年第6期809-815,共7页
无损分析样品内部的元素分布,对于材料、考古、地质科学等领域的研究具有重要意义。基于瞬发γ活化分析方法,结合中子照相技术,分析了模拟样品的结构和对称性,首次利用中国先进研究堆(CARR)水平孔道聚焦的微束中子束流,开展样品瞬发γ... 无损分析样品内部的元素分布,对于材料、考古、地质科学等领域的研究具有重要意义。基于瞬发γ活化分析方法,结合中子照相技术,分析了模拟样品的结构和对称性,首次利用中国先进研究堆(CARR)水平孔道聚焦的微束中子束流,开展样品瞬发γ扫描分析和材料内部元素分布研究。通过蒙特卡罗软件(MCNP)对样品元素分布实验模型进行分析,模拟结果获得了样品不同区域的铜、铁、铝元素分布,基本实现了元素空间分辨。MCNP计算结果表明在瞬发γ扫描分析中,优化准直几何参数和提高中子通量能进一步提高元素空间分辨和元素测量准确度。 展开更多
关键词 元素分布 瞬发γ活化分析 中子成像 微束中子 MCNP
下载PDF
面向自动驾驶的大模型对齐技术:综述
18
作者 唐小林 甘露 +2 位作者 李国法 李克强 褚文博 《汽车工程》 EI CSCD 北大核心 2024年第11期1937-1951,共15页
随着Transformer注意力机制的出现,以GPT为代表的通用基础大模型实现了智能的“涌现”,给自动驾驶迈向更高级别发展带来了曙光。受限于传统从头预训练方式需要大规模、高质量、多样性自动驾驶数据和高昂训练成本的困扰“,大模型+对齐技... 随着Transformer注意力机制的出现,以GPT为代表的通用基础大模型实现了智能的“涌现”,给自动驾驶迈向更高级别发展带来了曙光。受限于传统从头预训练方式需要大规模、高质量、多样性自动驾驶数据和高昂训练成本的困扰“,大模型+对齐技术”范式衍生。对齐技术作为通用基础大模型与自动驾驶之间的纽带,通过微调或提示工程等定制化方式,可高效、专业地解决自动驾驶领域内的工程性问题。对齐技术已是大模型在垂直领域发展的研究热点,但缺乏系统研究成果。基于此,本文首先对自动驾驶发展与大模型技术进行概述,从而衍生出对齐技术。然后,分别从微调和提示工程两个角度进行综述,系统化梳理并剖析各分类技术的结构或性能特点,同时给出实际的应用案例。最后,基于现有研究提出了对齐技术的研究挑战与发展趋势,为促进自动驾驶迈向更高级别发展提供参考。 展开更多
关键词 自动驾驶 大模型 综述 对齐技术 微调 提示工程
下载PDF
基于多模板提示调优和知识增强的事件因果关系识别方法
19
作者 张虎 李壮壮 +1 位作者 王宇杰 李茹 《中文信息学报》 CSCD 北大核心 2024年第9期48-57,共10页
事件因果关系识别(Event Causality Identification,ECI)是自然语言处理领域的一项重要研究任务,旨在识别文本中事件之间的因果关系。现有方法大都基于微调范式,不能较好发挥预训练语言模型的作用,难以有效捕获隐式因果关系识别的线索... 事件因果关系识别(Event Causality Identification,ECI)是自然语言处理领域的一项重要研究任务,旨在识别文本中事件之间的因果关系。现有方法大都基于微调范式,不能较好发挥预训练语言模型的作用,难以有效捕获隐式因果关系识别的线索。为此,该文提出了一种基于多模板提示调优和知识增强的事件因果关系识别方法。针对ECI任务设计独特的总提示模板,对显式和隐式事件因果关系分别设计不同的种子提示模板,集成训练所有提示模板,形成适应于ECI任务的提示调优方式。通过引入ConceptNet、Oxford Dictionaries等外部知识库,丰富事件的解释性知识和事件之间的关系性知识,将不同的知识融入提示模板,强化隐式因果关系线索。在EventStoryLine和Causal-TimeBank两个广泛使用的数据集上的实验结果表明,该文方法性能优于现有方法。 展开更多
关键词 事件因果关系识别 知识增强 提示调优 因果关系
下载PDF
基于连续提示注入与指针网络的农业病害命名实体识别
20
作者 王春山 张宸硕 +3 位作者 吴华瑞 朱华吉 缪祎晟 张立杰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第6期254-261,共8页
针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comp... 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2933条文本语料,8个实体类型,共10414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。 展开更多
关键词 农业病害 命名实体识别 连续提示 指针网络 嵌套实体 预训练语言模型
下载PDF
上一页 1 2 68 下一页 到第
使用帮助 返回顶部