-
题名基于多元组匹配损失的司法论辩理解方法
- 1
-
-
作者
张可
艾中良
刘忠麟
顾平莉
刘学林
-
机构
华北计算技术研究所大数据研发中心
中电科发展规划研究院有限公司
中国司法大数据研究院有限公司
中国卫星网络集团有限公司
-
出处
《计算机与现代化》
2024年第6期115-120,共6页
-
基金
国家重点研发计划(2022YFC3340900)。
-
文摘
司法论辩理解是论辩挖掘任务在司法领域的具体应用,旨在从诉辩双方观点中挖掘存在交互的观点对。司法领域论辩挖掘任务存在数据样本少、句子长度长、领域专业性强等问题,现有的司法论辩理解模型多基于文本分类思想,构建的模型文本语义表示能力差。为进一步提高论辩交互观点对的识别准确率,提出一种基于多元组匹配损失函数(Multiplet Loss)的司法论辩理解模型,该模型基于文本匹配的思想,将诉称观点与辩称观点分别进行语义相似性匹配,通过优化交互观点对的匹配度实现论辩交互观点对的挖掘。为提升模型对于论辩交互观点对的匹配度,提出多元组匹配损失函数,通过减小论辩交互观点对的语义距离,加大非交互观点的语义距离,使观点间的语义距离能更好地反应其交互性,采用司法领域预训练模型作为文本语义识别模型,进一步提高了文本的语义表达能力。采用CAIL2022论辩理解赛道数据进行测试,实验结果表明基于多元组匹配损失函数的司法论辩理解模型相较于采用分类思想的模型,准确率能够提高2.04个百分点,达到85.19%,提高了司法论辩理解任务精度。
-
关键词
多元组匹配损失
司法领域预训练模型
司法论辩理解
论辩挖掘
文本分类
自然语言处理
深度学习
-
Keywords
multiplet loss
pre-trained models in judicial domain
judicial argument understanding
argument mining
text classification
natural language processing
deep learning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融合触发词特征的事件抽取
- 2
-
-
作者
王立才
李兴宇
黄杨琛
罗琪彬
-
机构
华北计算技术研究所大数据研发中心
-
出处
《计算机系统应用》
2023年第10期229-234,共6页
-
文摘
事件抽取是信息抽取领域的重点研究方向.为了提升事件抽取效果,解决通用事件抽取方法无法充分利用文本特征信息的问题,提出了融合触发词特征的事件抽取方法.通过构建远程触发词库,为事件类型分类模型提供额外特征信息,增强事件触发词的发掘能力,再融合事件类型与触发词距离特征,提升事件要素抽取模型的表示学习能力,最后,将事件类型分类模型与事件要素抽取模型串联,提升事件抽取效果.在DuEE数据集上进行实验,与其他模型相比,本模型提升了准确率、召回率、F1值,证明了本模型的有效性.
-
关键词
事件抽取
预训练模型
特征工程
深度学习
自然语言处理
-
Keywords
event extraction
pre-trained model
feature engineering
deep learning
natural language processing(NLP)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于句粒度提示的大语言模型时序知识问答方法
- 3
-
-
作者
李志东
罗琪彬
乔思龙
-
机构
华北计算技术研究所大数据研发中心
-
出处
《网络安全与数据治理》
2023年第12期7-13,共7页
-
基金
173基础加强计划(2022-JCJQ-JJ-0935)。
-
文摘
知识问答是自然语言处理领域的研究热点之一,而时序知识问答还需考虑知识的时序关系,更是研究难点所在。当前时序知识问答方法通常将知识和问题的词向量相似度作为回答的重要依据,忽略了知识所蕴含的句粒度语义信息。对此,提出了一种基于句粒度提示的大语言模型时序知识问答方法,首先通过对句粒度提示的改进,让大语言模型高效学习句粒度语义信息,同时验证大语言模型在Zero-shot、Few-shot及弱监督微调下时序知识问答能力。在ICEWS05-15数据集上进行实验,所提方法回答正确准确率得到可观提升,体现了基于句粒度提示的大语言模型时序知识问答方法的有效性。
-
关键词
时序知识问答
大语言模型
提示学习
自然语言处理
-
Keywords
temporal knowledge graph question-answering
large language models
prompt learning
natural language processing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-