融合案件要素的相似案例匹配被引量：1

Incorporating Case Elements for Case Matching

下载PDF

导出

摘要相似案例匹配是智慧司法中的重要任务,其通过对比两篇案例的语义内容判别二者的相似程度,能够应用于类案检索、类案类判等。相对于普通文本,法律文书不仅篇幅更长,文本之间的区别也更微妙,传统深度匹配模型难以取得理想效果。为了解决上述问题,该文根据文书描写规律截取文书文本,并提出一种融合案件要素的方法来提高相似案件的匹配性能。具体来说,该文以民间借贷案件为应用场景,首先基于法律知识制定了6种民间借贷案件要素,利用正则表达式从法律文书中抽取案件要素,并形成词独热形式的案件要素表征;然后,对法律文本倒序截取,并通过BERT编码得到法律文本表征,解决法律文本的长距离依赖问题;接着使用线性网络融合法律文本表征与案件要素表征,并使用BiLSTM对融合的表征进行高维度化表示;最后通过孪生网络框架构建向量表征相似性矩阵,通过语义交互与向量池化进行最终的相似度判断。实验结果表明,该文模型能有效处理长文本并建模法律文本的细微差异,在CAIL2019-SCM公共数据集上优于基线模型。 Simiar Case matching is an important task in intelligent justice,especially for case retrieval and same-case same-judgment.Owing to the long text and the subtle difference between legal documents,existing deep matching models are difficult to achieve ideal results.To address this issue,this paper proposes a method of integrating case elements to improve the matching of similar cases with a focus on the private lending cases.First,six types of private lending case elements are formulated and extracted by regular expressions,represented in the form of one-hot word vectors.Then the legal text is filtered and formed in reverse order,represented by BERT capture the long-distance dependence.The legal text representation and the case element representation is fused by the linear network and then encoded by BiLSTM for high-dimensional representation.Finally,the vector representation similarity matrix is constructed through the twin network framework,and the final similarity is decided by semantic interaction and vector pooling.The experimental results show that the proposed model is better than the baseline model on the CAIL2019-SCM public data set.

作者刘权余正涛高盛祥何世柱刘康 LIU Quan;YU Zhengtao;GAO Shengxiang;HE Shizhu;LIU Kang(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650500,China;Yunnan Key Laboratory of Artificial Intelligence,Kunming University of Science and Technology,Kunming,Yunnan 650500,China;Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China)

机构地区昆明理工大学信息工程与自动化学院昆明理工大学云南省人工智能重点实验室中国科学院自动化研究所

出处《中文信息学报》 CSCD 北大核心 2022年第11期140-147,共8页 Journal of Chinese Information Processing

基金国家重点研发计划(2018YFC0830101,2018YFC0830105,2018YFC0830100) 国家自然科学基金(61972186,61761026,61762056) 云南省重大科技专项计划项目(202002AD080001-5) 云南省基础研究计划(202001AS070014,2018FB104) 云南省高新技术产业专项(201606) 云南省人培项目(KKSY201703005)。

关键词相似案例匹配案件要素预训练语言模型 case matching case elements pre-training language model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献21

1严悦,哈进兵.利用ART神经网络优化相似案例匹配方法[J].信息系统工程,2012,25(3):70-74. 被引量：3
2吕宾,侯伟亮.基于主题模型的法院文本典型案例推荐[J].微电子学与计算机,2018,35(2):128-132. 被引量：3
3李红海.案例指导制度的未来与司法治理能力[J].中外法学,2018,30(2):493-511. 被引量：35
4李兰君,周俊生,顾颜慧,曲维光.基于改进孪生网络结构的相似法律案例检索研究[J].北京大学学报（自然科学版）,2019,55(1):84-90. 被引量：7
5张扬武,李国和,王立梅.基于关键词加权的法律文本主题模型研究[J].计算机与数字工程,2019,47(5):1170-1174. 被引量：1
6乔钢柱,冯婷婷,张国晨.基于知识图谱的盗窃案件法律文书智能推理研究[J].计算机系统应用,2019,28(7):206-213. 被引量：7
7王君泽,马洪晶,张毅,杨兰蓉.裁判文书类案推送中的案情相似度计算模型研究[J].计算机工程与科学,2019,41(12):2193-2201. 被引量：17
8洪文兴,胡志强,翁洋,张恒,王竹,郭志新.面向司法案件的案情知识图谱自动构建[J].中文信息学报,2020,34(1):34-44. 被引量：27
9张骐.论案例裁判规则的表达与运用[J].现代法学,2020,42(5):35-49. 被引量：30
10孙海波.重新发现“同案”:构建案件相似性的判断标准[J].中国法学,2020(6):262-281. 被引量：70

引证文献1

1谢永峰,尹华,乔丹.类案检索技术研究综述[J].软件导刊,2024,23(6):198-204.

1劳拉·米尔斯,戴黛(译).镜子背后的秘密[J].环球科学,2022(24):54-55.
2陈文庆,郑淳允,任强,顾启清,江凯敏,廖冬琴.一种智能座舱方向盘和座椅迎宾系统设计方案[J].汽车电器,2022(11):8-9. 被引量：1
3张慧然.中国古代民间借贷研究述评[J].殷都学刊,2022,43(4):53-58.
4刁晏斌.由“舍小取大”现象看英语对华语词汇的影响[J].南京师范大学文学院学报,2022(4):139-145. 被引量：2
5汪瑄,王全权.汉字艺术形式之美[J].汉字文化,2022(15):7-8.
6刘旭康,张利敏,王延荣,刁占英,王根全,王浩宇,强慧,袁晓帅,柯庆航.不同活塞销孔衬套-活塞销摩擦副匹配性能研究[J].润滑与密封,2022,47(12):186-191. 被引量：1
7李宏宇,张学永,李珍.军机座舱研制中的人机工效验证与评价[J].飞机设计,2022,42(4):9-12. 被引量：1
8吴玲.财富保值增值的投资样本[J].支点,2022(12):24-26.
9曾勋.古代专门借债给官员的生意[J].领导文萃,2021(24):101-104.
10靳秀丽,于锋.基于金鱼拉丁字母理论浅析英文中的字母组合、词根词缀和简单词[J].现代英语,2022(18):81-90. 被引量：1

中文信息学报

2022年第11期

浏览历史

内容加载中请稍等...

融合案件要素的相似案例匹配被引量：1

同被引文献21

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合案件要素的相似案例匹配 被引量：1

同被引文献21

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合案件要素的相似案例匹配被引量：1