近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对...近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对齐的影响,诱使经过对齐的大语言模型产生有害输出.越狱攻击带来的滥用、劫持、泄露等问题已对基于大语言模型的对话系统与应用程序造成了严重威胁.对近年的越狱攻击研究进行了系统梳理,并基于攻击原理将其分为基于人工设计的攻击、基于模型生成的攻击与基于对抗性优化的攻击3类.详细总结了相关研究的基本原理、实施方法与研究结论,全面回顾了大语言模型越狱攻击的发展历程,为后续的研究提供了有效参考.对现有的安全措施进行了简略回顾,从内部防御与外部防御2个角度介绍了能够缓解越狱攻击并提高大语言模型生成内容安全性的相关技术,并对不同方法的利弊进行了罗列与比较.在上述工作的基础上,对大语言模型越狱攻击领域的现存问题与前沿方向进行探讨,并结合多模态、模型编辑、多智能体等方向进行研究展望.展开更多
单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE)是资源评估的前提和基础,为了更好地评估西北印度洋鸢乌贼资源,采用广义加性模型(generalized additive model,GAM)对2016~2020年西北印度洋鸢乌贼的CPUE进行了标准化。结果显示,月份...单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE)是资源评估的前提和基础,为了更好地评估西北印度洋鸢乌贼资源,采用广义加性模型(generalized additive model,GAM)对2016~2020年西北印度洋鸢乌贼的CPUE进行了标准化。结果显示,月份、海表温度(sea surface temperature,SST)、海面高度(sea surface height,SSH)、经度和纬度对CPUE呈显著性影响,通过对不同GAM模型的AIC (Akaike information criterion)值比较,由月份、SST、SSH、经度和纬度5个因子构成的GAM模型为最优CPUE标准化模型,对CPUE偏差的解释率为40.3%。研究表明,西北印度洋鸢乌贼高CPUE主要出现在9月至翌年3月,海域范围为16°~19°N、60°~65°E,SST为25~28°C、SSH为0.2~0.4 m的海域内。整体而言,标准化CPUE低于名义CPUE,但二者的变化趋势基本一致。展开更多
文摘近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对齐的影响,诱使经过对齐的大语言模型产生有害输出.越狱攻击带来的滥用、劫持、泄露等问题已对基于大语言模型的对话系统与应用程序造成了严重威胁.对近年的越狱攻击研究进行了系统梳理,并基于攻击原理将其分为基于人工设计的攻击、基于模型生成的攻击与基于对抗性优化的攻击3类.详细总结了相关研究的基本原理、实施方法与研究结论,全面回顾了大语言模型越狱攻击的发展历程,为后续的研究提供了有效参考.对现有的安全措施进行了简略回顾,从内部防御与外部防御2个角度介绍了能够缓解越狱攻击并提高大语言模型生成内容安全性的相关技术,并对不同方法的利弊进行了罗列与比较.在上述工作的基础上,对大语言模型越狱攻击领域的现存问题与前沿方向进行探讨,并结合多模态、模型编辑、多智能体等方向进行研究展望.
文摘单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE)是资源评估的前提和基础,为了更好地评估西北印度洋鸢乌贼资源,采用广义加性模型(generalized additive model,GAM)对2016~2020年西北印度洋鸢乌贼的CPUE进行了标准化。结果显示,月份、海表温度(sea surface temperature,SST)、海面高度(sea surface height,SSH)、经度和纬度对CPUE呈显著性影响,通过对不同GAM模型的AIC (Akaike information criterion)值比较,由月份、SST、SSH、经度和纬度5个因子构成的GAM模型为最优CPUE标准化模型,对CPUE偏差的解释率为40.3%。研究表明,西北印度洋鸢乌贼高CPUE主要出现在9月至翌年3月,海域范围为16°~19°N、60°~65°E,SST为25~28°C、SSH为0.2~0.4 m的海域内。整体而言,标准化CPUE低于名义CPUE,但二者的变化趋势基本一致。