-
题名法律案件要素识别混合专家大模型
- 1
-
-
作者
尹华
吴梓浩
柳婷婷
张佳佳
高子千
-
机构
广东财经大学数字经济学院
广东财经大学信息学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第12期3260-3271,共12页
-
基金
教育部人文社会科学研究青年基金项目(21YJCZH202)
广东省普通高校创新团队项目(2022WCXTD008)
广东省法学会法学研究委托课题项目(GDLS(2024C12))。
-
文摘
智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础任务上的效果不佳。提出了一种对话式混合专家要素识别大模型。该模型针对案件特点设计了特定的Prompt,供ChatGLM3-6B-base大模型学习;通过全参微调该大模型获得基础要素识别能力,其权重供后续混合专家共享,降低大模型学习成本;针对不同案件类型场景和标签不平衡场景,在大模型的注意力层引入案件DoRA专家和标签DoRA专家模块,提高模型对任务的区分度;设计可学习门控实现标签专家选择。在CAIL2019和某省脱敏盗窃案件要素识别数据集上,对比了三类方法的九个基准模型,并进行模型消融实验。实验结果显示,提出的模型综合性能F1值高于最优模型性能5.9个百分点;在标签不平衡的CAIL2019数据集上,标签专家一定程度上能够减缓数据极度不平衡给模型带来的影响;同时,CAIL2019上训练的模型不再需要全参微调,通过案件专家和标签专家轻量级微调后,在某省盗窃案件中取得最佳效果,证明模型具有易扩展性。
-
关键词
案件要素识别
大模型
混合参数高效专家
提示词
-
Keywords
legal case element recognition
large language model
mixture of parameter-efficiency expert
prompt
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-