基于深度条件依赖网络的裁判文书信息抽取

Information extraction of judgment documents based on deep conditional dependency network

下载PDF

导出

摘要裁判文书信息抽取旨在对裁判文书中包含的信息进行结构化处理,是法律人工智能研究的重要任务.目前的研究多是把裁判文书的信息抽取任务看成一个多标签文本分类任务,而没有考虑标签之间的依赖性.为此,提出了基于深度条件依赖网络的裁判文书信息抽取框架,用于裁判文书的案件要素信息抽取和争议焦点信息抽取.该框架由两部分组成,一是框架前端的特征提取网络用来挖掘裁判文书的文本特征,二是框架后端的标签关系网络来构建多个标签间的依赖性关系.在两个真实数据集上的实验结果表明,该模型在基线上都取得了显著且一致的改进,并且具有很好的扩展性,在该框架下可以获得多标签文本分类任务效果的提升. As an important task for legal artificial intelligence,judgment document information extraction aims to structurally process the information contained in the judgment document.Most of the current research regards the task of judgment document information extraction as a multi-label text classification work,without considering the dependency between labels.To solve this problem,we propose a framework for information extraction of judgment documents based on deep conditional dependency network(DCDN),which is used for the extraction of case-element information and dispute-focus information of judgment documents.The framework is composed of two parts described below.First,the feature extraction network in the front of the framework is used to mine the text features of judgment documents.Second,the label relationship network in the back of the framework is used to construct the dependency relationship between multiple labels.We conduct experiments on two real datasets.Experimental results show that our model achieves significant and consistent improvements over baselines and has good scalability,thus improving the performance of multi-label text classification task under this framework.

作者翁洋向迪郭晓冬洪文兴李鑫 WENG Yang;XIANG Di;GUO Xiaodong;HONG Wenxing;LI Xin(College of Mathematics,Sichuan University,Chengdu 610064,China;School of Aerospace Engineering,Xiamen University,Xiamen 361102,China;Law School,Sichuan University,Chengdu 610207,China)

机构地区四川大学数学学院厦门大学航空航天学院四川大学法学院

出处《厦门大学学报（自然科学版）》 CAS CSCD 北大核心 2022年第6期1021-1029,共9页 Journal of Xiamen University：Natural Science

基金国家重点研发计划(2020YFC0832400) 四川省重点研发计划(2021YFS0397)。

关键词裁判文书信息抽取案件要素争议焦点依赖关系建模 judgment documents information extraction case elements dispute focus dependency modeling

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1黄辉,秦永彬,陈艳平,黄瑞章.基于BERT阅读理解框架的司法要素抽取方法[J].大数据,2021,7(6):19-29. 被引量：3
2左卫民,王婵媛.基于裁判文书网的大数据法律研究:反思与前瞻[J].华东政法大学学报,2020,23(2):64-76. 被引量：37

二级参考文献21

1白建军.司法潜见对定罪过程的影响[J].中国社会科学,2013(1):167-185. 被引量：35
2张永健,程金华.法律实证研究的方法坐标[J].中国法律评论,2018(6):73-89. 被引量：30
3左卫民.“热”与“冷”:非法证据排除规则适用的实证研究[J].法商研究,2015,32(3):151-160. 被引量：103
4张忠民.生态破坏的司法救济——基于5792份环境裁判文书样本的分析[J].法学,2016(10):111-124. 被引量：27
5马超,于晓虹,何海波.大数据分析:中国司法裁判文书上网公开报告[J].中国法律评论,2016(4):195-246. 被引量：150
6徐明.大数据时代的隐私危机及其侵权法应对[J].中国法学,2017(1):130-149. 被引量：206
7左卫民.一场新的范式革命？--解读中国法律实证研究[J].清华法学,2017,11(3):45-61. 被引量：65
8雷鑫洪.方法论演进视野下的中国法律实证研究[J].法学研究,2017,39(4):97-116. 被引量：14
9赵一凡,卞良,丛昕.数据清洗方法研究综述[J].软件导刊,2017,16(12):222-224. 被引量：24
10张华.论指导案例的参照效力--基于1545份已公开裁判文书的实证分析[J].甘肃政法学院学报,2018(2):119-135. 被引量：10

共引文献38

1龚善要.人工智能司法应用的实践审思与完善[J].国家检察官学院学报,2023,31(5):95-108. 被引量：10
2刘东亮,闫玥蓉.大数据分析中的相关性和因果关系[J].国家检察官学院学报,2023,31(2):23-41. 被引量：12
3李雪松.从经验事实到规范研判:速裁上诉何去何从?[J].国家检察官学院学报,2021(2):115-134. 被引量：6
4林喜芬.大数据证据在刑事司法中的运用初探[J].法学论坛,2021,36(3):27-36. 被引量：67
5文姬.我国罚金刑裁量方法的改进[J].清华法学,2021,15(6):45-61. 被引量：11
6田旭.河北省醉酒型危险驾驶罪量刑实证研究[J].河北法学,2023,41(6):176-200. 被引量：6
7杨焘.数字化证据标准的合理性及限度分析——以上海“206”智能系统为关注点[J].四川师范大学学报（社会科学版）,2020,47(5):34-45. 被引量：10
8吕晓刚,杨彩虹.刑事强制医疗解除程序完善实证研究[J].河南财经政法大学学报,2020,35(6):137-145. 被引量：9
9徐浩然.认罪认罚对逮捕的影响实证研究——基于300份裁判文书的统计分析[J].四川警察学院学报,2020,32(6):19-30. 被引量：2
10崔媛媛,陈晖.北京市266例未成年患者医疗损害责任纠纷案例分析[J].中国卫生质量管理,2021,28(1):92-95. 被引量：2

1李代祎,李忠良,严丽.一种面向中文的实体关系联合抽取方法研究[J].小型微型计算机系统,2022,43(12):2479-2486. 被引量：7
2蒲生亮,骆玲新,谢小伟,邓非.采用神经架构搜索的高光谱图像深度学习分类方法[J].测绘地理信息,2022,47(S01):117-124.
3赵明明,蒋佳芹,尹泓澈,李礼,姚剑.基于非局部生成对抗网络的单张散焦图像去模糊[J].测绘地理信息,2022,47(S01):142-147.
4林炜,吴开军.融合多源图信息的图神经网络会话推荐算法[J].四川大学学报（自然科学版）,2022,59(6):51-61. 被引量：2
5张如雪,缪祥华.基于深度提升网络的入侵检测技术研究[J].化工自动化及仪表,2022,49(6):787-793.
6潘禺涵,舒远仲,洪晟,罗斌,聂云峰.基于多关系结构图神经网络的代码漏洞检测[J].网络安全与数据治理,2022,41(11):36-42.
7秦倩倩,张志军,袁卫华,桑胜,胡海星,王宜贵.融合元路径与改进协同注意力的推荐研究[J].计算机技术与发展,2022,32(12):150-158.
8赵倩,周冬明,杨浩,王长城,李淼.结合多尺度特征融合和多输入多输出编-解码器的去模糊算法[J].红外与激光工程,2022,51(10):343-355. 被引量：3
9陈港,张石清,赵小明.采用Transformer网络的视频序列表情识别[J].中国图象图形学报,2022,27(10):3022-3030. 被引量：6

厦门大学学报（自然科学版）

2022年第6期

浏览历史

内容加载中请稍等...

基于深度条件依赖网络的裁判文书信息抽取

参考文献2

二级参考文献21

共引文献38

相关作者

相关机构

相关主题

浏览历史