期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于边界识别与组合的裁判文书证据抽取方法研究
被引量:
5
1
作者
杨健
黄瑞章
+2 位作者
丁志远
陈艳平
秦永彬
《中文信息学报》
CSCD
北大核心
2020年第3期80-87,共8页
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",...
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。
展开更多
关键词
裁判文书
证据抽取
智慧法院
边界识别与组合
下载PDF
职称材料
融合标签信息的裁判文书证据抽取方法研究
2
作者
周裕林
鹿安琪
+1 位作者
周雯童
刘林红
《计算机与数字工程》
2022年第9期2025-2029,共5页
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器...
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引。实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93%。
展开更多
关键词
标签信息
裁判文书
机器阅读理解
证据抽取
下载PDF
职称材料
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
被引量:
5
3
作者
彭玉芳
陈将浩
何志强
《现代情报》
CSSCI
2022年第2期55-69,共15页
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过...
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。
展开更多
关键词
证据
性数据
抽取
TensorFlow
机器学习算法
深度学习算法
“5W”规则
下载PDF
职称材料
基于多视角图编码的选择式阅读理解方法
4
作者
余笑岩
何世柱
+3 位作者
宋燃
刘康
赵军
周永彬
《软件学报》
EI
CSCD
北大核心
2023年第11期5179-5190,共12页
选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提...
选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提出一种联合学习框架下基于多视角图编码的选择式阅读理解方法,从多视角充分挖掘文档句子之间以及文档句子和问句之间的关联关系,实现证据句及其关系的有效建模;同时通过联合训练证据抽取和答案预测任务,利用证据和答案之间强关联关系提升证据抽取与答案预测的性能.具体来说,所提方法首先基于多视角图编码模块对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义3个视角捕捉文档、问题和候选答案之间的关系,获得问答对感知的文档编码特征;然后,构建证据抽取和答案预测的联合学习模块,通过协同训练强化证据与答案之间的关系,证据抽取子模块实现证据句的选择,并将其结果和文档编码特征进行选择性融合,并用于答案预测子模块完成答案预测.在选择式阅读理解数据集ReCO和RACE上的实验结果表明,所提方法提升了从文档中选择证据句子的能力,进而提高答案预测的准确率.同时,证据抽取与答案预测联合学习很大程度减缓了传统流水线所导致的误差累积问题.
展开更多
关键词
选择式阅读理解
多视角图编码
证据抽取
答案预测
联合学习
下载PDF
职称材料
题名
基于边界识别与组合的裁判文书证据抽取方法研究
被引量:
5
1
作者
杨健
黄瑞章
丁志远
陈艳平
秦永彬
机构
贵州大学计算机科学与技术学院
贵州大学贵州省公共大数据重点实验室
出处
《中文信息学报》
CSCD
北大核心
2020年第3期80-87,共8页
基金
国家自然科学基金(U1836205)
国家自然科学基金(91746116)
+1 种基金
贵州省科技重大专项计划(黔科合重大专项字〔2017〕3002)
贵州省科学技术基金(黔科合基础〔2020〕18055)。
文摘
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。
关键词
裁判文书
证据抽取
智慧法院
边界识别与组合
Keywords
judgement document
evidence extraction
intelligent court
boundary detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合标签信息的裁判文书证据抽取方法研究
2
作者
周裕林
鹿安琪
周雯童
刘林红
机构
公共大数据国家重点实验室
贵州大学计算机科学与技术学院
出处
《计算机与数字工程》
2022年第9期2025-2029,共5页
基金
贵州大学大学生创新创业训练计划项目(编号:贵大(省)创字2021(055))资助。
文摘
针对信息抽取中,序列标注模型很难捕获句子的长距离语义而导致输入特征使用不充分,使得在裁判文书中的证据实体抽取上性能较差的问题,提出一种融合标签信息的裁判文书证据抽取方法。首先,将数据的序列标注格式转换为融合标签信息的机器阅读理解格式的三元组;其次,将文本信息与标签信息融合送入BERT预训练模型;最后,设定阈值,通过MLP输出预测的证据实体索引。实验结果表明:在2293篇裁判文书数据集上,论文提出的方法相较于传统序列标注模型,在F1值上提高了1.93%。
关键词
标签信息
裁判文书
机器阅读理解
证据抽取
Keywords
label information
judgment documents
machine reading comprehension
evidence extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
被引量:
5
3
作者
彭玉芳
陈将浩
何志强
机构
南京工程学院经济与管理学院
南京大学信息管理学院
中国科学技术大学数学科学学院
中国科学技术大学苏州研究院
出处
《现代情报》
CSSCI
2022年第2期55-69,共15页
基金
国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(项目编号:19ZDA347)
南京大学2015年度研究生创新工程“跨学科科研创新基金”项目“民国档案文献中的环中国南海文化电函与报道研究”(项目编号:2015CW04)
江苏省研究生培养创新工程项目“基于自动关联技术的南海问题证据链研究”(项目编号:KYLX15_0025)。
文摘
[目的/意义]本文尝试从文献载体到文献内容(全文检索)再到数据层面的细粒度的南海证据性数据抽取。首先,能提高南海文献数字资源的检索性能;其次,为专业人员提供充足的证据材料;最后,为南海维权的证据链关联模型构建做好基础。[方法/过程]根据南海维权证据的特点,制定抽取规则。通过文本清洗、文本分段、段分句、分词把非结构化的数据转化成结构化数据。然后分别比较朴素贝叶斯、SVM、随机森林、DNN、TexCNN、Bi-LSTM、LightGBM和XGBoost的证据性数据抽取效果。最后为了进一步提高证据抽取的准确性,增加了“5W”规则过滤和人工校验。[结果/结论]实验结果表明,基于TensorFlow深度学习框架,构建DNN模型的证据性数据抽取效果较好,准确率达0.88。通过进一步融合“5W”规则过滤和人工校验,显著地提高了南海证据性数据抽取的准确率,本文的证据抽取的方法具有一定的可行性。
关键词
证据
性数据
抽取
TensorFlow
机器学习算法
深度学习算法
“5W”规则
Keywords
evidence data extraction
TensorFlow
machine learning algorithm
deep learning algorithm
“5W”rule
分类号
G255 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于多视角图编码的选择式阅读理解方法
4
作者
余笑岩
何世柱
宋燃
刘康
赵军
周永彬
机构
中国科学院大学人工智能学院
中国科学院自动化研究所
中国科学院信息工程研究所
南京理工大学网络空间安全学院
出处
《软件学报》
EI
CSCD
北大核心
2023年第11期5179-5190,共12页
基金
国家重点研发计划(2020AAA0106400)
国家自然科学基金(61922085,61976211,U1936209,62002353)
+1 种基金
中国博士后科学基金(2021M701726)
中国科学院重点研究计划(ZDBS-SSW-JSC006)。
文摘
选择式阅读理解通常采用证据抽取和答案预测的两阶段流水线框架,答案预测的效果非常依赖于证据句抽取的效果.传统的证据抽取多依赖词段匹配或利用噪声标签监督证据抽取的方法,准确率不理想,这极大地影响了答案预测的性能.针对该问题,提出一种联合学习框架下基于多视角图编码的选择式阅读理解方法,从多视角充分挖掘文档句子之间以及文档句子和问句之间的关联关系,实现证据句及其关系的有效建模;同时通过联合训练证据抽取和答案预测任务,利用证据和答案之间强关联关系提升证据抽取与答案预测的性能.具体来说,所提方法首先基于多视角图编码模块对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义3个视角捕捉文档、问题和候选答案之间的关系,获得问答对感知的文档编码特征;然后,构建证据抽取和答案预测的联合学习模块,通过协同训练强化证据与答案之间的关系,证据抽取子模块实现证据句的选择,并将其结果和文档编码特征进行选择性融合,并用于答案预测子模块完成答案预测.在选择式阅读理解数据集ReCO和RACE上的实验结果表明,所提方法提升了从文档中选择证据句子的能力,进而提高答案预测的准确率.同时,证据抽取与答案预测联合学习很大程度减缓了传统流水线所导致的误差累积问题.
关键词
选择式阅读理解
多视角图编码
证据抽取
答案预测
联合学习
Keywords
multiple-choice reading comprehension
multi-view graph encoding
evidence extraction
answer prediction
joint learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于边界识别与组合的裁判文书证据抽取方法研究
杨健
黄瑞章
丁志远
陈艳平
秦永彬
《中文信息学报》
CSCD
北大核心
2020
5
下载PDF
职称材料
2
融合标签信息的裁判文书证据抽取方法研究
周裕林
鹿安琪
周雯童
刘林红
《计算机与数字工程》
2022
0
下载PDF
职称材料
3
基于机器学习和深度学习的南海证据性数据抽取算法比较与应用
彭玉芳
陈将浩
何志强
《现代情报》
CSSCI
2022
5
下载PDF
职称材料
4
基于多视角图编码的选择式阅读理解方法
余笑岩
何世柱
宋燃
刘康
赵军
周永彬
《软件学报》
EI
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部