期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
GPT系列大语言模型在自然语言处理任务中的鲁棒性
1
作者 陈炫婷 叶俊杰 +3 位作者 祖璨 许诺 桂韬 张奇 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1128-1142,共15页
大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤... 大语言模型(large language models,LLMs)所展现的处理各种自然语言处理(natural language processing,NLP)任务的能力引发了广泛关注.然而,它们在处理现实中各种复杂场景时的鲁棒性尚未得到充分探索,这对于评估模型的稳定性和可靠性尤为重要.因此,使用涵盖了9个常见NLP任务的15个数据集(约147000个原始测试样本)和来自TextFlint的61种鲁棒的文本变形方法分析GPT-3和GPT-3.5系列模型在原始数据集上的性能,以及其在不同任务和文本变形级别(字符、词和句子)上的鲁棒性.研究结果表明,GPT模型虽然在情感分析、语义匹配等分类任务和阅读理解任务中表现出良好的性能,但其处理信息抽取任务的能力仍较为欠缺,比如其对关系抽取任务中各种关系类型存在严重混淆,甚至出现“幻觉”现象.在鲁棒性评估实验中,GPT模型在任务层面和变形层面的鲁棒性都较弱,其中,在分类任务和句子级别的变形中鲁棒性缺乏更为显著.此外,探究了模型迭代过程中性能和鲁棒性的变化,以及提示中的演示数量和演示内容对模型性能和鲁棒性的影响.结果表明,随着模型的迭代以及上下文学习的加入,模型的性能稳步提升,但是鲁棒性依然亟待提升.这些发现从任务类型、变形种类、提示内容等方面揭示了GPT模型还无法完全胜任常见的NLP任务,并且模型存在的鲁棒性问题难以通过提升模型性能或改变提示内容等方式解决.通过对gpt-3.5-turbo的更新版本、gpt-4模型,以及开源模型LLaMA2-7B和LLaMA2-13B的性能和鲁棒性表现进行对比,进一步验证了实验结论.鉴于此,未来的大模型研究应当提升模型在信息提取以及语义理解等方面的能力,并且应当在模型训练或微调阶段考虑提升其鲁棒性. 展开更多
关键词 鲁棒性 GPT模型 大语言模型 自然语言处理 可靠性
下载PDF
PDCA循环管理法对血液肿瘤科患儿药物外渗的影响
2
作者 祖璨 《中外女性健康研究》 2020年第16期122-123,共2页
目的:探讨PDCA循环管理法对血液肿瘤科患儿药物外渗的影响。方法:选择本院2017年6月至2020年3月收治的42例血液肿瘤科患儿,根据入院先后顺序分为观察组(2019年1月至2020年3月,21例)及对照组(2017年6月至2018年12月,21例),对照组给予常... 目的:探讨PDCA循环管理法对血液肿瘤科患儿药物外渗的影响。方法:选择本院2017年6月至2020年3月收治的42例血液肿瘤科患儿,根据入院先后顺序分为观察组(2019年1月至2020年3月,21例)及对照组(2017年6月至2018年12月,21例),对照组给予常规护理,观察组给予PDCA循环管理,对比两组临床效果。结果:观察组药物外渗、静脉炎、局部坏死发生率明显较对照组低,P<0.05。观察组患儿家长对化疗药物外渗的健康知识掌握合格率及护理满意度明显较对照组高,P<0.05。结论:PDCA循环管理法可降低血液肿瘤科患儿药物外渗率,提高患儿家长满意度。 展开更多
关键词 PDCA循环管理法 血液肿瘤科 患儿 药物外渗 满意度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部