期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合对抗训练的中文GPT对话模型研究
1
作者
王伟
阮文翰
孟祥福
《辽宁工程技术大学学报(自然科学版)》
CAS
北大核心
2023年第3期378-384,共7页
在已清洗的中文会话数据集中进行预训练时存在对话模型泛化能力降低、微调后评价指标偏低的问题,为此采用对抗训练的方法,提出一种融合对抗训练的中文GPT对话模型。在微调过程中使用投影梯度下降法进行训练,使用Focal损失函数加快训练...
在已清洗的中文会话数据集中进行预训练时存在对话模型泛化能力降低、微调后评价指标偏低的问题,为此采用对抗训练的方法,提出一种融合对抗训练的中文GPT对话模型。在微调过程中使用投影梯度下降法进行训练,使用Focal损失函数加快训练速度。实验结果表明,融合对抗训练后,在有噪声的数据集微调和测试中,该模型与基线模型相比具有较强的抗干扰和泛化能力。
展开更多
关键词
生成对抗网络
投影梯度下降
对话
生成
中文预训练对话模型
泛化能力
下载PDF
职称材料
题名
融合对抗训练的中文GPT对话模型研究
1
作者
王伟
阮文翰
孟祥福
机构
辽宁工程技术大学基础教学部
辽宁工程技术大学电子与信息工程学院
中国建设银行沈阳浑南支行
出处
《辽宁工程技术大学学报(自然科学版)》
CAS
北大核心
2023年第3期378-384,共7页
基金
国家自然科学基金项目(61772249,61702241)
辽宁省教育厅基本科研项目(LJKZ0362)
中国煤炭科工集团重点项目(2019-ZD-003)
文摘
在已清洗的中文会话数据集中进行预训练时存在对话模型泛化能力降低、微调后评价指标偏低的问题,为此采用对抗训练的方法,提出一种融合对抗训练的中文GPT对话模型。在微调过程中使用投影梯度下降法进行训练,使用Focal损失函数加快训练速度。实验结果表明,融合对抗训练后,在有噪声的数据集微调和测试中,该模型与基线模型相比具有较强的抗干扰和泛化能力。
关键词
生成对抗网络
投影梯度下降
对话
生成
中文预训练对话模型
泛化能力
Keywords
generative adversarial network
projected gradient descent
dialogue generation
Chinese pre-training dialog model
generalization ability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合对抗训练的中文GPT对话模型研究
王伟
阮文翰
孟祥福
《辽宁工程技术大学学报(自然科学版)》
CAS
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部