大语言模型中的统计方法被引量：1

导出

摘要大语言模型也叫大型语言模型。ChatGPT的出现引来了公众对大语言模型关注的热潮。ChatGPT是由OpenAI公司训练的大语言模型,它通过学习大量文本数据中的语言模式来生成人类可读的文本。大语言模型是一种基于深度学习的自然语言处理技术,通过训练大规模的语料库来学习语言的内在结构和语义信息。在训练过程中,OpenAI使用了包括网络文本、书籍、新闻和其他文本资源的大量文本数据。通过这些数据,ChatGPT学习了语言的结构和语法,能够自动生成很有意义的文本。在训练和应用大语言模型的过程中,统计方法在多个方面发挥了关键作用。本文将介绍大语言模型中常用的几种统计方法,包括词频统计、TF-IDF、N-Gram、词向量表示、共现网络和语言模型推断等,并阐述它们在大语言模型中的应用。

作者房祥忠

机构地区北京大学

出处《中国统计》 2023年第9期41-43,共3页 China Statistics

关键词文本资源深度学习词频统计语言模型文本数据语言模式网络文本自然语言处理技术

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献5

1李伯虎,柴旭东,张霖,李潭,卿杜政,林廷宇,刘阳.面向新型人工智能系统的建模与仿真技术初步研究[J].系统仿真学报,2018,30(2):349-362. 被引量：76
2王春源,曹民和,曹小倩.量子计算人工智能的发展现状、应用和未来展望[J].海峡科学,2019(9):83-87. 被引量：4
3张乾君.AI大模型发展综述[J].通信技术,2023,56(3):255-262. 被引量：13
4车万翔,窦志成,冯岩松,桂韬,韩先培,户保田,黄民烈,黄萱菁,刘康,刘挺,刘知远,秦兵,邱锡鹏,万小军,王宇轩,文继荣,严睿,张家俊,张民,张奇,赵军,赵鑫,赵妍妍.大模型时代的自然语言处理:挑战、机遇与发展[J].中国科学：信息科学,2023,53(9):1645-1687. 被引量：63
5柯沛,雷文强,黄民烈.以ChatGPT为代表的大型语言模型研究进展[J].中国科学基金,2023,37(5):714-723. 被引量：11

引证文献1

1杨华,陈俭.突破大模型的天花板:物理语言在下一代人工智能中的作用[J].中国科技纵横,2024(15):20-23.

1周婷.地域文化元素在平面广告设计中的应用[J].中学地理教学参考,2023(23). 被引量：1
2李洋,罗建志.董事网络与企业数字化转型:影响效应及作用渠道[J].管理现代化,2023,43(5):98-107. 被引量：2
3袁飞.以生为本,高效写作——高中写作教学探究[J].作文成功之路,2022(48):77-79. 被引量：1
4张宇昂,李琦.基于Jetson TX2的路面病害检测应用[J].信息技术与信息化,2023(9):112-115. 被引量：1
5万维钢.伟大发明多是意外所得[J].中国科技财富,2023(9):60-61.
6杨秋珺.国内韧性社区研究及启示——基于CiteSpace的知识图谱分析[J].运筹与模糊学,2023,13(5):5514-5523.
7胡正荣,樊子塽.历史、变革与赋能:AIGC与全媒体传播体系的构建[J].科技与出版,2023(8):5-13. 被引量：11
8张亚立,李征宇,孙平.基于情感的多头注意力卷积Transformer + CNN的假新闻检测[J].数据挖掘,2023,13(4):299-311. 被引量：1
9廖欢,张依濛,杨巧琦,林旭程,王彦婕,吴小刚.基于网络文本的广州市儿童公园形象感知研究[J].山东林业科技,2023,53(5):96-101.
10韩长喜,陈卓,屈冰洋.ChatGPT在雷达中的应用浅析[J].电子工程信息,2023(4):16-18.

中国统计

2023年第9期

浏览历史

内容加载中请稍等...

大语言模型中的统计方法被引量：1

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

大语言模型中的统计方法 被引量：1

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

大语言模型中的统计方法被引量：1