-
题名融合标签信息的裁判文书证据抽取方法研究
- 1
-
-
作者
周裕林
鹿安琪
周雯童
刘林红
-
机构
公共大数据国家重点实验室
贵州大学计算机科学与技术学院
-
出处
《计算机与数字工程》
2022年第9期2025-2029,共5页
-
基金
贵州大学大学生创新创业训练计划项目(编号:贵大(省)创字2021(055))资助。
-
文摘
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引。实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93%。
-
关键词
标签信息
裁判文书
机器阅读理解
证据抽取
-
Keywords
label information
judgment documents
machine reading comprehension
evidence extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-