期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向问答领域的数据增强方法 被引量:1
1
作者 丁家杰 肖康 +2 位作者 叶恒 周夏冰 张民 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第1期54-60,共7页
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法。首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案... 针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法。首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留其中质量较高的数据作为最终的增强数据。该方法不需要额外的数据与领域知识,同时能够针对模型构造特定数据,耗费较少的训练代价就能使模型性能提升。实验结果表明,所提出的数据增强方法对R-Net,Bert-Base以及Luke均有效,与其他数据增强方法相比,在较少的增强数据规模下,问答模型获得更好的性能提升。 展开更多
关键词 数据增强 问题生成模型 自动问答模型 质量控制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部