期刊文献+

融合案件要素的相似案例匹配 被引量:1

Incorporating Case Elements for Case Matching
下载PDF
导出
摘要 相似案例匹配是智慧司法中的重要任务,其通过对比两篇案例的语义内容判别二者的相似程度,能够应用于类案检索、类案类判等。相对于普通文本,法律文书不仅篇幅更长,文本之间的区别也更微妙,传统深度匹配模型难以取得理想效果。为了解决上述问题,该文根据文书描写规律截取文书文本,并提出一种融合案件要素的方法来提高相似案件的匹配性能。具体来说,该文以民间借贷案件为应用场景,首先基于法律知识制定了6种民间借贷案件要素,利用正则表达式从法律文书中抽取案件要素,并形成词独热形式的案件要素表征;然后,对法律文本倒序截取,并通过BERT编码得到法律文本表征,解决法律文本的长距离依赖问题;接着使用线性网络融合法律文本表征与案件要素表征,并使用BiLSTM对融合的表征进行高维度化表示;最后通过孪生网络框架构建向量表征相似性矩阵,通过语义交互与向量池化进行最终的相似度判断。实验结果表明,该文模型能有效处理长文本并建模法律文本的细微差异,在CAIL2019-SCM公共数据集上优于基线模型。 Simiar Case matching is an important task in intelligent justice,especially for case retrieval and same-case same-judgment.Owing to the long text and the subtle difference between legal documents,existing deep matching models are difficult to achieve ideal results.To address this issue,this paper proposes a method of integrating case elements to improve the matching of similar cases with a focus on the private lending cases.First,six types of private lending case elements are formulated and extracted by regular expressions,represented in the form of one-hot word vectors.Then the legal text is filtered and formed in reverse order,represented by BERT capture the long-distance dependence.The legal text representation and the case element representation is fused by the linear network and then encoded by BiLSTM for high-dimensional representation.Finally,the vector representation similarity matrix is constructed through the twin network framework,and the final similarity is decided by semantic interaction and vector pooling.The experimental results show that the proposed model is better than the baseline model on the CAIL2019-SCM public data set.
作者 刘权 余正涛 高盛祥 何世柱 刘康 LIU Quan;YU Zhengtao;GAO Shengxiang;HE Shizhu;LIU Kang(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650500,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming,Yunnan 650500,China;Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China)
出处 《中文信息学报》 CSCD 北大核心 2022年第11期140-147,共8页 Journal of Chinese Information Processing
基金 国家重点研发计划(2018YFC0830101,2018YFC0830105,2018YFC0830100) 国家自然科学基金(61972186,61761026,61762056) 云南省重大科技专项计划项目(202002AD080001-5) 云南省基础研究计划(202001AS070014,2018FB104) 云南省高新技术产业专项(201606) 云南省人培项目(KKSY201703005)。
关键词 相似案例匹配 案件要素 预训练语言模型 case matching case elements pre-training language model
  • 相关文献

同被引文献21

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部