-
题名基于边界识别与组合的裁判文书证据抽取方法研究
被引量:5
- 1
-
-
作者
杨健
黄瑞章
丁志远
陈艳平
秦永彬
-
机构
贵州大学计算机科学与技术学院
贵州大学贵州省公共大数据重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2020年第3期80-87,共8页
-
基金
国家自然科学基金(U1836205)
国家自然科学基金(91746116)
+1 种基金
贵州省科技重大专项计划(黔科合重大专项字〔2017〕3002)
贵州省科学技术基金(黔科合基础〔2020〕18055)。
-
文摘
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。
-
关键词
裁判文书
证据抽取
智慧法院
边界识别与组合
-
Keywords
judgement document
evidence extraction
intelligent court
boundary detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-