大型语言模型在法律文本零样本语义标注中不可思议的有效性

The unreasonable effectiveness of large language models in zero-shot semantic annotation of legal texts

导出

摘要 ChatGPT的出现使得包括法律界在内的公众认识到大型语言模型(LLMs)的潜在用途(如文件起草、问题回答和摘要)。尽管该技术在以法律文本为重点的各种语义注释任务中表现良好,但随着更新、功能更强(GPT-4)或更具成本效益(GPT-3.5-turbo)的模型涌入,需要探讨其对法律文本进行语义标注能力的最新进展。在向成熟的生成式人工智能系统过渡的过程中,通过检验GPT-4和GPT-3.5-turbo(-16k)的性能,并将其与上一代GPT模型进行比较,结果显示GPT-4和GPT-3.5-turbo(-16k)在涉及判决意见、合同条款或法律条文的三项法律文本注释任务中表现出色。比较各类模型的性能和成本发现,GPT-4模型在三项任务中的两项上明显优于GPT-3.5模型,性价比高的GPT-3.5-turbo与价格高出20倍的text-davinci-003模型性能相当。虽然可以在单个提示中注释多个数据点,但其性能会随着批量的增加而降低。这项工作为许多实际应用(如合同审查)和研究项目(如实证法律研究)提供了有价值的信息。法律学者和执业律师都可以利用这些发现来指导他们将大型语言模型整合到涉及法律文本语义标注的各种工作流程中的决策。

作者凯文·阿什利孙自豪(译) Jaromir Savelka;Κevin D.Ashley

机构地区美国卡内基梅隆大学计算机科学学院美国匹兹堡大学法学院华东政法大学

出处《法律方法》 2024年第2期247-276,共30页 Legal Method

基金 2018年度国家社科基金重大项目“新兴学科视野中的法律逻辑及其拓展研究”子课题“基于大数据的智能法律检索”(项目号18ZDA034)的阶段性研究成果

关键词法律文本分析大型语言模型(LLM) 零样本分类语义标注文本标注

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] D910 [政治法律—法学]

引文网络
相关文献

1人力资源社会保障部有关司局负责同志就《职称评审监管暂行办法》答记者问[J].劳动和社会保障法规政策专刊,2024(9):51-52.
2凯文·D.阿什利,黄子耿(译).法律分析的前景:从法律文本中提取更多含义的方法论[J].法律方法,2023(4):260-289.
3葛晓帅,王梦.大语言模型辅助下基于词典的义项表生成及应用研究[J].语料库语言学,2024,11(1):26-37.
4吕占锋.公共资源交易大数据分类分级研究[J].信息产业报道,2024(9):0084-0086.
5刘风丽.近年美国“白人至上”话语的回潮——对美国平权运动最高法院判例的批判话语分析[J].中南民族大学学报（人文社会科学版）,2024,44(6):122-129.
6张帆,窦鹏程.建筑工程中的结构优化设计与实践应用[J].安家,2024(6):0127-0129.
7徐新韵.中国古代档案文献的整理、数字化与知识化研究[J].山西档案,2024(7):125-127.
8余戈杰.五位一体,追求高品质家庭视听享受星环幻星5.1 Turbo智能影K套装[J].家庭影院技术,2024(10):19-21.
9苏泽鑫,厉明杰,赵欣颖,初肖仪.锂电池电解液添加剂的最新研究进展[J].山东化工,2024,53(17):136-138.
10杨承玉.城市规划如何促进酒类产业的可持续发展[J].中国酒,2024(9):46-47.

法律方法

2024年第2期

浏览历史

内容加载中请稍等...

大型语言模型在法律文本零样本语义标注中不可思议的有效性

相关作者

相关机构

相关主题

浏览历史