事实核查是指基于证据文本的虚假信息检测任务,目前已有的研究方法主要是将声明文本与证据文本拼接后输入预训练模型进行分类判断,或者通过单一节点的全连接图进行推理判断。这些方法忽略了证据文本间的远距离语义关联和其包含的噪声干...事实核查是指基于证据文本的虚假信息检测任务,目前已有的研究方法主要是将声明文本与证据文本拼接后输入预训练模型进行分类判断,或者通过单一节点的全连接图进行推理判断。这些方法忽略了证据文本间的远距离语义关联和其包含的噪声干扰。针对以上问题,该文提出了一种基于跨证据文本实体关系的图卷积神经网络模型(C ross-E vidence Entity R elation Reasoning M odel,CERM)。该模型以多个证据文本的实体共现关系为基础,聚合不同实体对象的语义结构信息,同时减小噪声信息干扰,有效提升模型的虚假信息判别能力。实验结果证明,在公开数据集上该文提出的方法在通用评测指标上均优于现有的对比模型,验证了CERM模型在事实核查研究任务上的有效性。展开更多
语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影...语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影响。在标准数据集CoNLL-2014 Test Set上的实验结果表明,本文提出的方法能显著提升语法错误纠正的性能。展开更多
文摘事实核查是指基于证据文本的虚假信息检测任务,目前已有的研究方法主要是将声明文本与证据文本拼接后输入预训练模型进行分类判断,或者通过单一节点的全连接图进行推理判断。这些方法忽略了证据文本间的远距离语义关联和其包含的噪声干扰。针对以上问题,该文提出了一种基于跨证据文本实体关系的图卷积神经网络模型(C ross-E vidence Entity R elation Reasoning M odel,CERM)。该模型以多个证据文本的实体共现关系为基础,聚合不同实体对象的语义结构信息,同时减小噪声信息干扰,有效提升模型的虚假信息判别能力。实验结果证明,在公开数据集上该文提出的方法在通用评测指标上均优于现有的对比模型,验证了CERM模型在事实核查研究任务上的有效性。
文摘语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影响。在标准数据集CoNLL-2014 Test Set上的实验结果表明,本文提出的方法能显著提升语法错误纠正的性能。