大语言模型安全现状与挑战被引量：15

Security of Large Language Models:Current Status and Challenges

下载PDF

导出

摘要大语言模型因其出色的文本理解和生成能力,被广泛应用于自然语言处理领域并取得了显著成果,为社会各界带来了巨大的便利。然而,大语言模型自身仍存在明显的安全问题,严重影响其应用的可信性与可靠性,是安全学者需广泛关注的问题。文中针对大语言模型自身的安全问题,首先从基于大语言模型的恶意应用问题切入,阐述提示注入攻击及其相应的防御方法;其次,介绍大语言模型幻觉带来的可信问题,对幻觉问题的量化评估、幻觉来源和缓解技术是当前研究的重点;然后,大语言模型隐私安全问题强调了个人及企业数据的保护问题,一旦在进行人机交互时泄露商业秘密和个人敏感信息,将可能引发严重的安全风险,当前研究主要通过可信执行环境和隐私计算技术来进行风险规避;最后,提示泄露问题关注攻击者如何窃取有价值的提示词进行获利或通过个性化提示词泄露个人隐私。提升大语言模型的安全性需要综合考虑模型隐私保护、可解释性研究以及模型分布的稳定性与鲁棒性等问题。 Large language models have revolutionized natural language processing,offering exceptional text understanding and generation capabilities that benefit society significantly.However,they also pose notable security challenges,demanding the attention of security researchers.This paper introduces these concerns,including malicious applications with prompt injection attacks,reliable issues arising from model hallucinations,privacy risks tied to data protection,and the problem of prompt leakage.To enhance model security,a comprehensive approach is required,focusing on privacy preservation,interpretability research,and model distribution stability and robustness.

作者赵月何锦雯朱申辰李聪仪张英杰陈恺 ZHAO Yue;HE Jinwen;ZHU Shenchen;LI Congyi;ZHANG Yingjie;CHEN Kai(Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100085,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 101408,China)

机构地区中国科学院信息工程研究所中国科学院大学网络安全学院

出处《计算机科学》 CSCD 北大核心 2024年第1期68-71,共4页 Computer Science

关键词大语言模型人工智能安全恶意应用模型幻觉隐私安全提示泄露 Large language models AI security Malicious applications Model hallucinations Privacy security Prompt leakage

分类号 TP389 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献83

1郝福锦.人工智能科技与毕业生高质量就业[J].山西财经大学学报,2023,45(S02):86-88. 被引量：3
2肖艺能.数字经济时代人工智能的伦理风险及治理[J].山西财经大学学报,2023,45(S02):77-79. 被引量：1
3王蕴嘉,张琪.ChatGPT在学术期刊编辑领域的应用与展望[J].编辑学报,2023,35(S01):127-131. 被引量：3
4吴莹,卢雨霞,陈家建,王一鸽.跟随行动者重组社会--读拉图尔的《重组社会：行动者网络理论》[J].社会学研究,2008(2):218-234. 被引量：236
5唐海军.长尾理论经济学原理探析[J].现代管理科学,2009(1):62-64. 被引量：40
6李阳,李纲.工程化与平行化的融合:大数据时代下的应急决策情报服务构思[J].图书情报知识,2016,33(3):4-14. 被引量：34
7金娣,童康.我国中小学教师教学技能主观评价的影响路径研究[J].教师教育研究,2017,29(2):66-70. 被引量：5
8张涛,贾真,李天瑞,黄雁勇.基于知识库的开放领域问答系统[J].智能系统学报,2018,13(4):557-563. 被引量：13
9刘普.我国学术不端问题的现状与治理路径——基于媒体报道的64起学术不端典型案例的分析[J].中国科学基金,2018,32(6):637-644. 被引量：45
10张雅娴.翻转课堂教学法在应用型本科院校师范生教学技能训练中的行动研究[J].呼伦贝尔学院学报,2019,27(5):114-117. 被引量：2

引证文献15

1李文心,唐勇.生成式人工智能技术应用于公安“智慧大脑”:前景、风险及对策[J].武汉公安干部学院学报,2024,38(1):29-33.
2贾广付.AI大模型在航运业的应用[J].世界海运,2024,47(4):14-18.
3李新新.AIGC时代学术不端的新形式及其治理[J].数字出版研究,2024,3(2):113-118. 被引量：2
4程小梅.大语言模型在电视领域的应用[J].电视技术,2024,48(3):153-155.
5郑佳斌,周瀚阁,蒋忠林,陈勇.航天涉密信息保密审核大模型增强方法[J].航天控制,2024,42(2):62-68.
6窦凤岐,胡珊,李佳隆,张莹莹.基于LangChain的RAG问答系统设计与实现——以C语言课程问答系统为例[J].信息与电脑,2024,36(6):101-103. 被引量：1
7洪亮,郭瑶,刘兴丽,李宗雨.基于RAG的煤矿安全智能问答模型[J].黑龙江科技大学学报,2024,34(3):487-492.
8李帅峥,钱正,董正浩,史翔.政务大模型的技术应用路径及发展建议[J].信息通信技术与政策,2024,50(6):76-82.
9程辉,刘松弢,李武.作为新质生产力的技术创新驱动:AI2.0时代有声出版产业链建设现状、挑战及对策[J].出版发行研究,2024(6):46-53.
10张旭,牛宇翔,刘卿,王力华.基于大模型的医疗对话“声-智”一体化应用实践[J].中国数字医学,2024,19(8):14-17.

二级引证文献3

1蒋素琼,吴飞盈,吴昔昔,谢浩煌,季魏红.人工智能时代数字化平台学术诚信体系的建设与应用[J].编辑学报,2024,36(4):421-424.
2裴壮,田秀霞,李冰雪.知识图谱赋能的面向对象程序设计C++教学改革与实践[J].华东师范大学学报（自然科学版）,2024(5):104-113.
3黄先蓉,李永政.学术不端行为治理研究[J].科技与出版,2024(9):6-12.

1丁娜.高等院校艺术设计类基础课程实践教学刍议[J].美术教育研究,2023(21):155-157.
2秦风.泄露商业秘密,跳槽员工赔偿原公司60万元[J].法制与新闻,2022(21):46-47.
3关生全.乡村振兴战略背景下的高中地理教学与核心素养培养[J].中华活页文选（高中版）,2023(23):81-83.
4柴荔,王萧,龚嘉豪,汪洋,吉顺慧,张鹏程.面向供应链的共识算法研究综述[J].计算机与现代化,2023(11):22-27. 被引量：1
5汪赋偲,许安.非正式员工商业秘密保护管理风险防范对策分析[J].质量与认证,2023(10):47-49.
6钱莹莹.从传商喜《明宣宗行乐图》探宣宗形象[J].美术界,2023(11):88-90.
7黄君.音乐情绪感知跨文化研究的现状与挑战[J].黄钟（武汉音乐学院学报）,2023(4):142-149. 被引量：1
8卢方.高职会计专业财经素养教育与课程思政的融合路径探析[J].会计师,2023(19):137-139. 被引量：1
9法律解答10问[J].法制与社会,2022(19):43-46.
10黄新平.个性化学习理论下的高中化学教育模式创新路径[J].中文科技期刊数据库（全文版）教育科学,2023(12):194-197.

计算机科学

2024年第1期

浏览历史

内容加载中请稍等...

大语言模型安全现状与挑战被引量：15

同被引文献83

引证文献15

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

大语言模型安全现状与挑战 被引量：15

同被引文献83

引证文献15

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

大语言模型安全现状与挑战被引量：15