期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于预训练模型和联合调参的改进训练算法
下载PDF
职称材料
导出
摘要
一、引言 诸如BERT和Open-GPT等预训练语言模型的引入,为NLP研究和工业界带来了巨大的进步,这些模型的贡献可以分为两个方面.首先,经过预训练的语言模型使建模人员可以利用少量数据获得合理的准确性,这种策略与经典的深度学习方法相反,经典的深度学习方法需要大量的数据才能达到可比的结果.其次,对于许多NLP任务,例如SQuAD,CoQA,命名实体识别,Glue,机器翻译,预训练的模型如果给定合理数量的标记数据,可以创造新的State-of-the-art记录.
作者
苏海波
刘译璟
机构地区
北京百分点信息科技有限公司
出处
《中国信息化》
2020年第2期44-49,共6页
关键词
命名实体识别
预训练
机器翻译
训练算法
标记数据
深度学习
语言模型
OPEN
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
引文网络
相关文献
节点文献
二级参考文献
0
参考文献
0
共引文献
0
同被引文献
0
引证文献
0
二级引证文献
0
1
汤学华.
土木工程钢结构施工技术有关问题的思考[J]
.建材发展导向,2020,18(5):99-99.
被引量:2
2
张鹏飞,李冠宇,贾彩燕.
面向自然语言推理的基于截断高斯距离的自注意力机制[J]
.计算机科学,2020,47(4):178-183.
被引量:1
3
陆兵,周国华,顾晓清,殷新春.
迁移拉普拉斯总间隔支持向量机[J]
.南京理工大学学报,2020,44(1):40-48.
被引量:5
4
王眉灵.
从大飞机上的“四川造”到国产民机运营先锋[J]
.大飞机,2019,0(12):12-18.
被引量:1
5
王华树,曹达钦.
新时代本地化翻译技术的创新与发展--《应用程序本地化》评析[J]
.中国科技翻译,2020,33(1):62-64.
被引量:1
6
程宁.
古籍专名数据库的构建与统计分析[J]
.文教资料,2019(35):52-56.
被引量:1
7
刘畅.
浅谈PANDAI的设计与实现[J]
.缔客世界,2019(1):7-7.
8
苏立新,郭嘉丰,范意兴,兰艳艳,程学旗.
基于标签增强的机器阅读理解模型[J]
.模式识别与人工智能,2020,33(2):106-112.
被引量:2
9
孙淑芳,党晖.
梅里丘克的形态学思想及其语言符号观[J]
.当代语言学,2020,22(1):134-145.
10
刘伟.
抽油机井多功能电动机调整座研制与应用[J]
.中国设备工程,2020,0(1):248-249.
被引量:3
中国信息化
2020年 第2期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部