中文预训练模型研究进展被引量：10

Advances in Chinese Pre-training Models

下载PDF

导出

摘要近年来,预训练模型在自然语言处理领域蓬勃发展,旨在对自然语言隐含的知识进行建模和表示,但主流预训练模型大多针对英文领域。中文领域起步相对较晚,鉴于其在自然语言处理过程中的重要性,学术界和工业界都开展了广泛的研究,提出了众多的中文预训练模型。文中对中文预训练模型的相关研究成果进行了较为全面的回顾,首先介绍预训练模型的基本概况及其发展历史,对中文预训练模型主要使用的两种经典模型Transformer和BERT进行了梳理,然后根据不同模型所属类别提出了中文预训练模型的分类方法,并总结了中文领域的不同评测基准,最后对中文预训练模型未来的发展趋势进行了展望。旨在帮助科研工作者更全面地了解中文预训练模型的发展历程,继而为新模型的提出提供思路。 In recent years,pre-training models have flourished in the field of natural language processing,aiming at modeling and representing the implicit knowledge of natural language.However,most of the mainstream pre-training models target at the English domain,and the Chinese domain starts relatively late.Given its importance in the natural language processing process,extensive research has been conducted in both academia and industry,and numerous Chinese pre-training models have been proposed.This paper presents a comprehensive review of the research results related to Chinese pre-training models,firstly introducing the basic overview of pre-training models and their development history,then sorting out the two classical models Transformer and BERT that are mainly used in Chinese pre-training models,then proposing a classification method for Chinese pre-training models according to model categories,and summarizes the different evaluation benchmarks in the Chinese domain.Finally,the future development trend of Chinese pre-training models is prospected.It aims to help researchers to gain a more comprehensive understanding of the development of Chinese pre-training models,and then to provide some ideas for the proposal of new models.

作者侯钰涛阿布都克力木·阿布力孜哈里旦木·阿布都克里木 HOU Yu-tao;ABULIZI Abudukelimu;ABUDUKELIMU Halidanmu(School of Information Management,Xinjiang University of Finance and Economics,Urumqi 830012,China)

机构地区新疆财经大学信息管理学院

出处《计算机科学》 CSCD 北大核心 2022年第7期148-163,共16页 Computer Science

基金国家自然科学基金(61866035,61966033)。

关键词中文预训练模型自然语言处理词向量预处理深度学习 Chinese pre-training models Natural language processing Word embedding Pre-training Deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献101

1张智雄,刘欢,丁良萍,吴朋民,于改红.不同深度学习模型的科技论文摘要语步识别效果对比研究[J].数据分析与知识发现,2019,3(12):1-9. 被引量：23
2李雪思,张智雄,刘欢.基于BERT模型实现概念定义句自动识别[J].情报科学,2022,40(8):160-166. 被引量：3
3阿布都克力木·阿布力孜,张雨宁,阿力木江·亚森,郭文强,哈里旦木·阿布都克里木.预训练语言模型的扩展模型研究综述[J].计算机科学,2022,49(S02):43-54. 被引量：11
4侯汉清,黄刚.电子计算机与文献分类[J].现代图书情报技术,1982(1):5-14. 被引量：10
5张朝胜,郭剑毅,线岩团,余正涛,雷春雅,王海雄.基于条件随机场的英文产品命名实体识别[J].计算机工程与科学,2010,32(6):115-117. 被引量：13
6庞观松,蒋盛益.文本自动分类技术研究综述[J].情报理论与实践,2012,35(2):123-128. 被引量：33
7周丽红,刘勘.基于关联规则的科技文献分类研究[J].图书情报工作,2012,56(4):12-16. 被引量：9
8郭华源.一种DICOM文件并行查找算法的设计与实现[J].北京生物医学工程,2012,31(2):174-177. 被引量：2
9王方,阮梅花,朱海刚,熊燕,缪有刚.基于向量空间模型的科技文献自动分类研究[J].情报探索,2013(12):1-3. 被引量：5
10白光祖,何远标,马建霞,刘建华,邹益民.利用小样本量机器学习实现学术文摘结构的自动识别[J].现代图书情报技术,2014(7):34-40. 被引量：9

引证文献10

1孙凯丽,罗旭东,罗有容.预训练语言模型的应用综述[J].计算机科学,2023,50(1):176-184. 被引量：9
2陈姝睿,梁子然,饶洋辉.细粒度语义知识图谱增强的中文OOV词嵌入学习[J].计算机科学,2023,50(3):72-82. 被引量：2
3赵瑞雪,黄永文,马玮璐,董文佳,鲜国建,孙坦.ChatGPT对图书馆智能知识服务的启示与思考[J].农业图书情报学报,2023,35(1):29-38. 被引量：72
4蔡子凡,蔚海燕.人工智能生成内容(AIGC)的演进历程及其图书馆智慧服务应用场景[J].图书馆杂志,2023,42(4):34-43. 被引量：78
5杨晔,裴雷,侯凤贞.基于中文医药文本的实体识别和图谱构建[J].中国药科大学学报,2023,54(3):363-371. 被引量：1
6林子洛.基于深度学习语言模型的心理学领域文本分类[J].软件,2023,44(7):112-118. 被引量：2
7郭华源,刘思凯,饶宠佑,贺志阳,何昆仑.住院电子病历分型分类训练模型构建研究[J].中国卫生信息管理杂志,2023,20(6):897-903.
8杜新玉,李宁.中文学术论文全文语步识别研究[J].数据分析与知识发现,2024,8(2):74-83. 被引量：2
9安波.基于提示学习的小样本文献分类方法[J].图书馆论坛,2024,44(5):96-104. 被引量：1
10于浩,郭赟赟.风险与超越:ChatGPT赋能翻译的伦理分析[J].中国翻译,2024,45(4):115-122.

二级引证文献157

1高翔.GPT型技术赋能数字人文:概念解构、应用前景与现实问题[J].知识管理论坛,2024(2):109-119.
2刘知明,孙晗,彭志军.AIGC视域下非遗文创产品的数字化转型升级路径研究[J].包装工程,2024,45(S01):147-153.
3储节旺,杜秀秀,李佳轩.人工智能生成内容对智慧图书馆服务的冲击及应用展望[J].情报理论与实践,2023,46(5):6-13. 被引量：55
4孙雷亮.基于GPT模型的人工智能数据伪造风险研究[J].信息安全研究,2023,9(6):518-523. 被引量：3
5李晔,李龙,刘絮宁,鄢一笑.人工智能技术在辅助农业微生物科研选题中的应用分析[J].农村科学实验,2023(11):55-57.
6江丽.通用人工智能(AGI)类ChatGPT出现,图书馆会消失吗?[J].图书馆界,2023(3):6-10. 被引量：6
7施志唐.ChatGPT对图书馆的影响与应对措施[J].图书情报导刊,2023,8(4):1-7. 被引量：8
8段荟,张海,王东波.信息资源管理领域科研人员对ChatGPT态度、认知及应对策略研究[J].情报理论与实践,2023,46(7):17-24. 被引量：21
9马乐存,詹希旎,朱齐宇,孙榕,李白杨.AIGC驱动的GLAM数智融合创新发展研究[J].农业图书情报学报,2023,35(5):4-15. 被引量：3
10寿建琪.走向“已知之未知”:GPT大语言模型助力实现以人为本的信息检索[J].农业图书情报学报,2023,35(5):16-26. 被引量：4

1钟诚.王永康到省自然资源厅调研[J].黑龙江国土资源,2022(1).
2张宏礼,揭育瑞,欧阳芷雅,张鸿雁.数学师范专业数学建模课程中课程思政要素的挖掘[J].岭南师范学院学报,2022,43(2):114-118. 被引量：5
3司马紫薇,李娜.法律视角下黑龙江省饮用水水源地保护问题研究[J].黑龙江工业学院学报（综合版）,2022,22(5):130-134. 被引量：3
4李振权,李功燕.基于卷积通道剪枝与多任务的脐橙分级算法[J].计算机应用与软件,2022,39(5):220-224. 被引量：2
5唐焕玲,卫红敏,王育林,朱辉,窦全胜.结合LDA与Word2vec的文本语义增强方法[J].计算机工程与应用,2022,58(13):135-145. 被引量：22
6腊志垚,钱育蓉,冷洪勇,顾天宇,张继元,李自臣.基于随机游走的图嵌入研究综述[J].计算机工程与应用,2022,58(13):1-13. 被引量：7
7王浩,王宝丽,安晓丹.概率统计分析在深度生成模型中的应用[J].运城学院学报,2022,40(3):65-68. 被引量：1
8白雪娜.期刊编辑在科研人员认识核心期刊中的能动作用与作为[J].科技传播,2022,14(9):36-39. 被引量：1
9李葛葛.某地下室无梁楼盖结构坍塌事故成因分析与研究[J].安徽建筑,2022,29(6):162-164. 被引量：1
10郭蔚.广通河水系和政县段生态治理工程中泄洪箱涵规模分析[J].陕西水利,2022(7):110-111.

计算机科学

2022年第7期

浏览历史

内容加载中请稍等...

中文预训练模型研究进展被引量：10

同被引文献101

引证文献10

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

中文预训练模型研究进展 被引量：10

同被引文献101

引证文献10

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

中文预训练模型研究进展被引量：10