期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于边界识别与组合的裁判文书证据抽取方法研究 被引量:5
1
作者 杨健 黄瑞章 +2 位作者 丁志远 陈艳平 秦永彬 《中文信息学报》 CSCD 北大核心 2020年第3期80-87,共8页
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",... 裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。 展开更多
关键词 裁判文书 证据抽取 智慧法院 边界识别与组合
下载PDF
融合标签信息的裁判文书证据抽取方法研究
2
作者 周裕林 鹿安琪 +1 位作者 周雯童 刘林红 《计算机与数字工程》 2022年第9期2025-2029,共5页
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器... 针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引。实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93%。 展开更多
关键词 标签信息 裁判文书 机器阅读理解 证据抽取
下载PDF
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用 被引量:5
3
作者 彭玉芳 陈将浩 何志强 《现代情报》 CSSCI 2022年第2期55-69,共15页
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过... [目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。 展开更多
关键词 证据性数据抽取 TensorFlow 机器学习算法 深度学习算法 “5W”规则
下载PDF
基于多视角图编码的选择式阅读理解方法
4
作者 余笑岩 何世柱 +3 位作者 宋燃 刘康 赵军 周永彬 《软件学报》 EI CSCD 北大核心 2023年第11期5179-5190,共12页
选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提... 选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提出一种联合学习框架下基于多视角图编码的选择式阅读理解方法,从多视角充分挖掘文档句子之间以及文档句子和问句之间的关联关系,实现证据句及其关系的有效建模;同时通过联合训练证据抽取和答案预测任务,利用证据和答案之间强关联关系提升证据抽取与答案预测的性能.具体来说,所提方法首先基于多视角图编码模块对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义3个视角捕捉文档、问题和候选答案之间的关系,获得问答对感知的文档编码特征;然后,构建证据抽取和答案预测的联合学习模块,通过协同训练强化证据与答案之间的关系,证据抽取子模块实现证据句的选择,并将其结果和文档编码特征进行选择性融合,并用于答案预测子模块完成答案预测.在选择式阅读理解数据集ReCO和RACE上的实验结果表明,所提方法提升了从文档中选择证据句子的能力,进而提高答案预测的准确率.同时,证据抽取与答案预测联合学习很大程度减缓了传统流水线所导致的误差累积问题. 展开更多
关键词 选择式阅读理解 多视角图编码 证据抽取 答案预测 联合学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部