基于预训练模型和联合调参的改进训练算法

下载PDF

导出

摘要一、引言诸如BERT和Open-GPT等预训练语言模型的引入,为NLP研究和工业界带来了巨大的进步,这些模型的贡献可以分为两个方面.首先,经过预训练的语言模型使建模人员可以利用少量数据获得合理的准确性,这种策略与经典的深度学习方法相反,经典的深度学习方法需要大量的数据才能达到可比的结果.其次,对于许多NLP任务,例如SQuAD,CoQA,命名实体识别,Glue,机器翻译,预训练的模型如果给定合理数量的标记数据,可以创造新的State-of-the-art记录.

作者苏海波刘译璟

机构地区北京百分点信息科技有限公司

出处《中国信息化》 2020年第2期44-49,共6页

关键词命名实体识别预训练机器翻译训练算法标记数据深度学习语言模型 OPEN

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

1汤学华.土木工程钢结构施工技术有关问题的思考[J].建材发展导向,2020,18(5):99-99. 被引量：2
2张鹏飞,李冠宇,贾彩燕.面向自然语言推理的基于截断高斯距离的自注意力机制[J].计算机科学,2020,47(4):178-183. 被引量：1
3陆兵,周国华,顾晓清,殷新春.迁移拉普拉斯总间隔支持向量机[J].南京理工大学学报,2020,44(1):40-48. 被引量：5
4王眉灵.从大飞机上的“四川造”到国产民机运营先锋[J].大飞机,2019,0(12):12-18. 被引量：1
5王华树,曹达钦.新时代本地化翻译技术的创新与发展--《应用程序本地化》评析[J].中国科技翻译,2020,33(1):62-64. 被引量：1
6程宁.古籍专名数据库的构建与统计分析[J].文教资料,2019(35):52-56. 被引量：1
7刘畅.浅谈PANDAI的设计与实现[J].缔客世界,2019(1):7-7.
8苏立新,郭嘉丰,范意兴,兰艳艳,程学旗.基于标签增强的机器阅读理解模型[J].模式识别与人工智能,2020,33(2):106-112. 被引量：2
9孙淑芳,党晖.梅里丘克的形态学思想及其语言符号观[J].当代语言学,2020,22(1):134-145.
10刘伟.抽油机井多功能电动机调整座研制与应用[J].中国设备工程,2020,0(1):248-249. 被引量：3

中国信息化

2020年第2期

浏览历史

内容加载中请稍等...

基于预训练模型和联合调参的改进训练算法

相关作者

相关机构

相关主题

浏览历史