大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGL...大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGLM的模型,并提出一种面向医疗领域的知识图谱(Knowledge Graphs,KGs)和LLM相结合的框架。框架主要包含两个部分:首先,通过KG三元组中的实体和关系,提出了一种基于KG结构数据的提示工程方法,使得LLM更加具有医学领域的专用知识,提高LLM的可解释性;其次,提出一种利用KG来对齐LLM的方法,将LLM的输出与KG的相关知识进行比较,验证LLM输出结果的一致性和准确性,从而增强了LLM在医疗领域的安全性。实验结果表明,最终生成的MedKGGPT模型能够输出更加具有安全性的结果,说明KG能够有效增强LLM的可解释性,为LLM应用在医疗领域提供了帮助。展开更多
随着Chat GPT的发布,大型语言模型(large language model,LLM)已经在全球迅速崭露头角并在各行各业广泛应用。与此同时,以中文语言为基础的大型语言模型研究逐渐展开,其在教育领域的应用与效果也有待研究。为此,文章以10年高考题目数据...随着Chat GPT的发布,大型语言模型(large language model,LLM)已经在全球迅速崭露头角并在各行各业广泛应用。与此同时,以中文语言为基础的大型语言模型研究逐渐展开,其在教育领域的应用与效果也有待研究。为此,文章以10年高考题目数据集“GAOKAO-Bench”为测试数据,通过统计和分析11个不同来源(包括大型企业、学术机构和新兴公司)的开源中文大型语言模型在9个不同学科(语文、数学、英语、物理、化学、生物、历史、政治、地理)中的表现,来评估不同的中文大型语言模型在教育教学自动评估中的效果。随后,文章根据评估结果,从多学科、多维度出发,对模型在各个科目上的推理表现进行分析研究。最后,文章对中文大型语言模型在教育教学自动评估中可能遇到的挑战与问题进行探讨,并提出可供优化的思路与方法,以期推动中文大型语言模型在未来教育教学中的发展与传播。展开更多
文摘大型语言模型(Large Language Models,LLM)已经成为现今主流的研究热点,而垂直领域行业大模型则成为落地应用的关键点,以医疗为代表的大型语言模型有着可解释性、可靠性、高安全性等要求。针对这类问题,提出MedKGGPT模型,一个基于ChatGLM的模型,并提出一种面向医疗领域的知识图谱(Knowledge Graphs,KGs)和LLM相结合的框架。框架主要包含两个部分:首先,通过KG三元组中的实体和关系,提出了一种基于KG结构数据的提示工程方法,使得LLM更加具有医学领域的专用知识,提高LLM的可解释性;其次,提出一种利用KG来对齐LLM的方法,将LLM的输出与KG的相关知识进行比较,验证LLM输出结果的一致性和准确性,从而增强了LLM在医疗领域的安全性。实验结果表明,最终生成的MedKGGPT模型能够输出更加具有安全性的结果,说明KG能够有效增强LLM的可解释性,为LLM应用在医疗领域提供了帮助。
文摘随着Chat GPT的发布,大型语言模型(large language model,LLM)已经在全球迅速崭露头角并在各行各业广泛应用。与此同时,以中文语言为基础的大型语言模型研究逐渐展开,其在教育领域的应用与效果也有待研究。为此,文章以10年高考题目数据集“GAOKAO-Bench”为测试数据,通过统计和分析11个不同来源(包括大型企业、学术机构和新兴公司)的开源中文大型语言模型在9个不同学科(语文、数学、英语、物理、化学、生物、历史、政治、地理)中的表现,来评估不同的中文大型语言模型在教育教学自动评估中的效果。随后,文章根据评估结果,从多学科、多维度出发,对模型在各个科目上的推理表现进行分析研究。最后,文章对中文大型语言模型在教育教学自动评估中可能遇到的挑战与问题进行探讨,并提出可供优化的思路与方法,以期推动中文大型语言模型在未来教育教学中的发展与传播。