期刊文献+

基于边界识别与组合的裁判文书证据抽取方法研究 被引量:5

Extracting Evidences from Judgment Document via Entity Boundary Detection
下载PDF
导出
摘要 裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。 Evidences in judgment document are fundamental to the human judgment of a case, and then can be applied to access the case quality or support the "Intelligent Court". To deal with the long and nested evidence extraction, this paper proposes an extraction model base on boundary detection and combination. Firstly, the BiLSTM-CRF model is used to detect begin and end boundaries of the evidences. Then assembling those boundaries into candidate evidences with plenty of fine-grained information. Finally, a tri-channel multi-core CNN classification model is applied to select the correct candidate. Experimental results show our method produces promising results.
作者 杨健 黄瑞章 丁志远 陈艳平 秦永彬 YANG Jian;HUANG Ruizhang;DING Zhiyuan;CHEN Yanping;QIN Yongbin(College of Computer Science and Technology,Guizhou University,Guiyang,Guizhou 550025,China;Guizhou Provincial Key Laboratory of Public Big Data,Guizhou University,Guiyang,Guizhou 550025,China)
出处 《中文信息学报》 CSCD 北大核心 2020年第3期80-87,共8页 Journal of Chinese Information Processing
基金 国家自然科学基金(U1836205) 国家自然科学基金(91746116) 贵州省科技重大专项计划(黔科合重大专项字〔2017〕3002) 贵州省科学技术基金(黔科合基础〔2020〕18055)。
关键词 裁判文书 证据抽取 智慧法院 边界识别与组合 judgement document evidence extraction intelligent court boundary detection
  • 相关文献

参考文献5

二级参考文献28

  • 1贾崇柏.赵树理小说人物外号的艺术性[J].山西大学学报(哲学社会科学版),1989,12(3):82-85. 被引量:2
  • 2钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量:26
  • 3MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
  • 4MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
  • 5李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
  • 610 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
  • 7Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
  • 8Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
  • 9Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
  • 10Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.

共引文献787

同被引文献98

引证文献5

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部