摘要
大语言模型(Large Language Model,简称 LLM)是一种深度学习模型,通过对大量文本数据进行采集、训练,捕捉和理解语言的复杂性,从而完成文本生成、翻译、问答等任务,代表了自然语言处理技术的最新发展。在其发展史上,从简单的 N-gram 模型到复杂的神经网络结构,语言模型经历了多个发展阶段。现代大型语言模型,如BERT、GPT 和 XLNet,已经成为自然语言处理的标杆,展示了令人震惊的效果。大语言模型在机器视觉任务中的应用尚处于较初级阶段,但已经展示出巨大的潜力,已具备实现图像描述生成、图像分类、目标检测等功能的能力。
出处
《信息产业报道》
2023年第10期130-132,共3页
Information Industry Report