摘要
该研究选取16个热门大语言模型,探究其在5个典型语言处理任务上的表现,最后对参测模型进行综合评价。研究发现,闭源大模型GPT-4和GPT-3.5-Turbo综合表现最佳,开源大模型中Baichuan2-7B-Chat表现突出,Qwen-7B-Chat次之,ChatGLM2-6B和ChatGLM-6B合格。模型的领域生成能力差异巨大,该研究旨在为语言文学研究者提供模型的选择建议,促进语言文学研究与人工智能的交叉融合。
作者
赵雪
赵志枭
孙凤兰
王东波
ZHAO Xue;ZHAO Zhixiao;SUN Fenglan;WANG Dongbo
出处
《外语电化教学》
CSSCI
北大核心
2023年第6期57-65,共9页
Technology Enhanced Foreign Language Education
基金
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331)
国家社科基金一般项目“基于语料库的中国学者学术英语口语研究”(项目编号:16BYY098)的阶段性研究成果。