期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合对抗训练的中文GPT对话模型研究
1
作者 王伟 阮文翰 孟祥福 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2023年第3期378-384,共7页
在已清洗的中文会话数据集中进行预训练时存在对话模型泛化能力降低、微调后评价指标偏低的问题,为此采用对抗训练的方法,提出一种融合对抗训练的中文GPT对话模型。在微调过程中使用投影梯度下降法进行训练,使用Focal损失函数加快训练... 在已清洗的中文会话数据集中进行预训练时存在对话模型泛化能力降低、微调后评价指标偏低的问题,为此采用对抗训练的方法,提出一种融合对抗训练的中文GPT对话模型。在微调过程中使用投影梯度下降法进行训练,使用Focal损失函数加快训练速度。实验结果表明,融合对抗训练后,在有噪声的数据集微调和测试中,该模型与基线模型相比具有较强的抗干扰和泛化能力。 展开更多
关键词 生成对抗网络 投影梯度下降 对话生成 中文预训练对话模型 泛化能力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部