期刊文献+
共找到6,776篇文章
< 1 2 250 >
每页显示 20 50 100
论大语言模型材料的证据属性——以ChatGPT和文心一言为例 被引量:3
1
作者 徐继敏 严若冰 《四川师范大学学报(社会科学版)》 北大核心 2024年第1期60-73,M0006,M0007,共16页
以ChatGPT和文心一言为代表的大语言模型产生海量大语言模型材料,此类材料进入社会生活并产生广泛影响,讨论大语言模型材料证据属性具有重要意义。大语言模型材料可以成为证据,但是否具有证据资格需要在具体个案中进行判断。从诉讼效率... 以ChatGPT和文心一言为代表的大语言模型产生海量大语言模型材料,此类材料进入社会生活并产生广泛影响,讨论大语言模型材料证据属性具有重要意义。大语言模型材料可以成为证据,但是否具有证据资格需要在具体个案中进行判断。从诉讼效率出发,大语言模型证据在不同诉讼中的呈现形式可以有所区别:一般案件可以仅举示人机交流材料和使用者本地环境信息,重大案件则应完整举示。大语言模型材料区别于大数据证据和一般的人工智能证据,具有直观性强、可解释性弱、偏在于少数技术公司、可识别性弱等特点。 展开更多
关键词 语言模型 语言模型材料 语言模型证据 AIGC
下载PDF
大型语言模型对高等教育的影响与中国应对 被引量:2
2
作者 吴丰华 韩文龙 《高等理科教育》 2024年第1期75-83,共9页
大型语言模型(LLM)在短期内将从创设教学情境、创新教学模式、教学AI开发和应用、拓展高校在线学习、助力虚拟仿真课程开发等方面助力高等教育;长期来看能够助推“四新”建设、赋能基础学科拔尖人才培养,并催生高校结构性变革。同时,LL... 大型语言模型(LLM)在短期内将从创设教学情境、创新教学模式、教学AI开发和应用、拓展高校在线学习、助力虚拟仿真课程开发等方面助力高等教育;长期来看能够助推“四新”建设、赋能基础学科拔尖人才培养,并催生高校结构性变革。同时,LLM也可能引发教育安全风险,造成新的教育智能鸿沟,并被大企业寡头垄断。为促进LLM赋能中国高等教育,需要我国加快开发迭代自己的LLM,促进其均等化可达,提升师生数字素养和能力,夯实数字化教学环境。 展开更多
关键词 大型语言模型 GPT 高等教育 中国式现代化
下载PDF
是“神马”还是“灰犀牛”:ChatGPT等大语言模型对教育的多维影响及应对之策 被引量:5
3
作者 陆道坤 李淑婷 《新疆师范大学学报(哲学社会科学版)》 北大核心 2024年第2期106-124,共19页
ChatGPT以“入侵”的方式在教育领域登陆,初露“灰犀牛”面貌,由此引发教育思想、教育体系和学校教育层面的危机。在教育思想层面,多将ChatGPT视为“神马”,在态度上选择抵制和观望,其背后既有思维惯性、惰性等历史原因,也有因ChatGPT... ChatGPT以“入侵”的方式在教育领域登陆,初露“灰犀牛”面貌,由此引发教育思想、教育体系和学校教育层面的危机。在教育思想层面,多将ChatGPT视为“神马”,在态度上选择抵制和观望,其背后既有思维惯性、惰性等历史原因,也有因ChatGPT等大语言模型管理制度缺位导致安全感无处寄放的现实依据。就教育体系而言,ChatGPT引发的教育自洽与替代焦虑加持,将从内外两个角度解构既有的教育目标体系,由此带来基于人的自由全面发展的教育目标体系的重构;ChatGPT将推动知识生产与知识学习的转向,进而以知识教育价值重估为“支点”,撬动教育整体价值重估,促使教育立足“人本”和“高阶”开展价值创造;ChatGPT还将引发学生发展与评价标准、方式的变革,渐次推动教育评价体系的全面创新。就学校教育而言,知识学习的变革必将推动学校教育时空的重组和学校生态的创新,使课堂教学由“三维”向“四维”转型,进而推动教学生态重塑、流程再造和课堂教学革命,引发教师角色、工作方式和发展方式的变革。 展开更多
关键词 灰犀牛 ChatGPT 人工智能 语言模型 教育 入侵 影响 应对
下载PDF
大语言模型在中学历史学科中的应用测评分析 被引量:1
4
作者 申丽萍 何朝帆 +2 位作者 曹东旭 朱云彬 吴永和 《现代教育技术》 2024年第2期62-71,共10页
大语言模型一经发布便获得广泛关注,但其在实际应用特别是教育领域的应用还存在诸多局限与挑战,因此需要对大语言模型在中文语境下的能力与风险进行测评。基于此,文章首先收集整理了一个包括10万条客观选择题与10套中学主观题测试卷的... 大语言模型一经发布便获得广泛关注,但其在实际应用特别是教育领域的应用还存在诸多局限与挑战,因此需要对大语言模型在中文语境下的能力与风险进行测评。基于此,文章首先收集整理了一个包括10万条客观选择题与10套中学主观题测试卷的中学历史数据集,并在以ChatGPT、GPT-4和讯飞星火为代表的大语言模型上测试了该数据集中题目的回答表现。然后,文章详细分析了测试结果,发现虽然当前大语言模型的突出能力在于能够产生完整且流畅的表达,但其在中学历史知识测试中仍远低于适龄学生的平均水平,大语言模型应用于教育领域仍存在可靠性较差、可信度较低、具有偏见与歧视、推理能力不足、无法自动更新知识等问题。最后,文章针对大语言模型在中文语境下教育领域的应用提出建议,以期助力大语言模型在教育领域发挥更大的作用,为学生、教师带来更好的学习和教学体验。 展开更多
关键词 语言模型 ChatGPT 讯飞星火 教育应用 测评
下载PDF
大语言模型的技术应用前景与风险挑战 被引量:3
5
作者 徐月梅 胡玲 +2 位作者 赵佳艺 杜宛泽 王文清 《计算机应用》 CSCD 北大核心 2024年第6期1655-1662,共8页
针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative P... 针对大语言模型(LLM)技术的快速发展,剖析它的技术应用前景和风险挑战,对通用人工智能(AGI)的发展和治理有重要参考价值。首先,以Multi-BERT(Multilingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-Trained Transformer)等语言模型为代表,综述LLM的发展脉络、核心技术和评估体系;其次,分析LLM现存的技术局限和安全风险;最后,提出LLM在技术上改进、政策上跟进的建议。分析指出作为发展阶段的LLM,现有模型存在非真实性及偏见性输出、实时自主学习能力欠缺,算力需求庞大,对数据质量和数量依赖性强,语言风格单一;存在数据隐私、信息安全和伦理等方面的安全风险。未来发展可从技术上继续改进,从“大规模”转向“轻量化”、从“单模态”走向“多模态”、从“通用”迈入“垂类”;从政策上实时跟进,实施有针对性的监管措施,规范应用和发展。 展开更多
关键词 语言模型 风险挑战 技术监管 应用前景 通用人工智能
下载PDF
大语言模型赋能场景生成和双层优化的多农业园区供电-灌溉-蓄水耦合运行
6
作者 董俊 束洪春 +2 位作者 刘瑞 龙文桢 张广斌 《高电压技术》 EI CAS CSCD 北大核心 2024年第7期2906-2917,I0007-I0009,共15页
传统农灌负荷的使用具有集中性和无序性,显著加剧电力系统的供需不平衡与运行成本。为提升农业园区运行的经济性和光伏资源的消纳能力,通过刻画农灌负荷特性,结合作物生长用能需求,提出一种基于大语言模型(largelanguagemodel,LLM)场景... 传统农灌负荷的使用具有集中性和无序性,显著加剧电力系统的供需不平衡与运行成本。为提升农业园区运行的经济性和光伏资源的消纳能力,通过刻画农灌负荷特性,结合作物生长用能需求,提出一种基于大语言模型(largelanguagemodel,LLM)场景生成和双层优化的多农业园区优化调度模型。该模型利用LLM时序分析能力进行光伏短期发电功率预测,然后通过LLM知识推理能力构建农业用水知识图谱,知识图谱中丰富的语义关系辅助LLM推理和预测,生成更符合实际情况的农业供电-灌溉-蓄水场景。双层优化调度模型在生成场景基础上,以园区经济运行为优化目标,对多农业园区供电-灌溉-蓄水进行耦合优化调度。最后,通过仿真验证,本文所提出的方法显著提升了农业园区电力系统运行稳定性,并有效降低了系统运行成本。 展开更多
关键词 农灌负荷特性 语言模型 知识抽取 知识图谱 双层优化模型
下载PDF
大语言模型在英语教学中的角色 被引量:1
7
作者 许家金 赵冲 《外语教育研究前沿》 北大核心 2024年第1期3-10,90,共9页
本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,... 本文提炼了大语言模型在英语教学应用中扮演的三种角色,即语言顾问、语伴和语言测评专家。在语言顾问角色中,模型为师生提供语言知识,充当母语者或语言学家。在语伴角色中,模型协助用户完成语言交际任务,可以作为听说练习中的对话伙伴,也可以是读写练习中的小组讨论成员。在语言测评专家角色中,模型分析用户提供的语言材料,并对相关语言表现进行评价。本文主要展示了如何利用提示工程在听、说、读、写、译教学中发挥大语言模型的三类角色作用。 展开更多
关键词 语言模型 教学角色 英语教学 提示工程 人机协同
下载PDF
JADE-DB:基于靶向变异的大语言模型安全通用基准测试集
8
作者 张谧 潘旭东 杨珉 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1113-1127,共15页
提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十... 提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制.根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过70%,测试问题均可同时触发多款模型违规生成.这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质. 展开更多
关键词 生成式人工智能安全 语言模型 语言模型安全评测 人工智能安全 自然语言处理
下载PDF
面向网络安全领域的大语言模型技术综述
9
作者 张长琳 仝鑫 +1 位作者 佟晖 杨莹 《信息网络安全》 CSCD 北大核心 2024年第5期778-793,共16页
近年来,随着大语言模型技术的迅速发展,其在医疗、法律等众多领域已经显现出应用潜力,同时为网络安全领域的发展提供了新的方向。文章首先综述了大语言模型的设计原理、训练机制及核心特性等基础理论,为读者提供了必要的背景知识。然后... 近年来,随着大语言模型技术的迅速发展,其在医疗、法律等众多领域已经显现出应用潜力,同时为网络安全领域的发展提供了新的方向。文章首先综述了大语言模型的设计原理、训练机制及核心特性等基础理论,为读者提供了必要的背景知识。然后,深入探讨了大语言模型在识别和处置日益增长的网络威胁方面的作用,详细阐述了其在渗透测试、代码安全审查、社会工程学攻击以及网络安全专业知识评估方面的研究进展。最后,分析了该技术在安全性、成本和可解释性等方面的挑战并展望了未来的发展方向。 展开更多
关键词 语言模型 ChatGPT 网络安全
下载PDF
预训练大语言模型发展对中国数字创意产业的启示
10
作者 魏晓 陈茂清 +1 位作者 曹小琴 许芳婷 《科技管理研究》 2024年第12期123-129,共7页
预训练大语言模型与数字创意产业的结合,一方面可以促进预训练大语言模型技术研发和应用,推动自然语言处理相关产业发展,另一方面也可以为数字创意产业提供更高效、精准的解决方案,促进产业数字化转型升级。然而,目前中国预训练大语言... 预训练大语言模型与数字创意产业的结合,一方面可以促进预训练大语言模型技术研发和应用,推动自然语言处理相关产业发展,另一方面也可以为数字创意产业提供更高效、精准的解决方案,促进产业数字化转型升级。然而,目前中国预训练大语言模型在数字创意产业的运用主要侧重于文本识别生成和语音生成等领域。为此,通过阐述预训练大语言模型以及中国数字创意产业的发展现状,梳理预训练大语言模型在数字创意产业的应用范畴和商业布局,综合分析作为新质生产力引擎的预训练大语言模型在中国数字创意产业发展中的机遇与挑战,并为中国数字创意产业的发展提出建议。研究发现:融合发展是中国数字创意产业的重要趋势,网络文学、动漫游戏、短视频等细分产业开始发展出完整的产业链条;预训练大语言模型可提升数字创意产业的内容生成效率、丰富艺术创意、拓展数字娱乐形式,也可以加强社交媒体分析监测、提高跨语言应用的效率、辅助科研教育,带来提升数字创意产业的智能化水平、增强用户黏性、数字创意生产者身份多元化等机遇,但同时也面临数据成本、隐私安全、知识产权等问题。提出未来在预训练大语言模型应用于数字创意产业的发展中,重视构建相关监管评估框架和知识产权保护体系,提升多模态技术水平,强化智能算力体系建设,以推动数字创意产业的智能化发展。 展开更多
关键词 语言模型 预训练模型 数字创意产业 自然语言处理技术 文本生成 人工智能 产业智能化 融合发展
下载PDF
智能语言模型工具对程序设计类课程教学的挑战与应对
11
作者 曲海鹏 刘培顺 +1 位作者 马慧 蒋永国 《计算机教育》 2024年第5期107-110,117,共5页
根据实际案例分析人工智能技术驱动的大语言模型工具对程序设计类课程教学带来的挑战,对该工具在学习过程中的各种不合规使用提出防范方法和措施,同时指出未来它带给程序设计类课程教学的机遇。
关键词 程序设计教学 学术诚信 智能语言模型
下载PDF
大语言模型融合知识图谱的医学问答系统构建研究
12
作者 胡佳慧 李姣 +3 位作者 姚宽达 徐晓巍 娄培 方安 《中国数字医学》 2024年第6期91-95,共5页
大语言模型(LLM)具有强大的学习和推理能力,然而由于缺乏内部知识,该模型面临幻觉挑战。针对医学问答对高质量专业知识的需求,本研究提出一种大语言模型融合知识图谱的医学问答方法,并将其应用于医学科技信息知识服务平台(MedKaaS)的问... 大语言模型(LLM)具有强大的学习和推理能力,然而由于缺乏内部知识,该模型面临幻觉挑战。针对医学问答对高质量专业知识的需求,本研究提出一种大语言模型融合知识图谱的医学问答方法,并将其应用于医学科技信息知识服务平台(MedKaaS)的问答系统构建。研究表明,相比传统的知识库问答(KBQA)和新兴的基于生成式大语言模型的问答,本文所提出的大语言模型融合知识图谱的方法充分综合了二者的优势,并为医学问答提供了证据溯源支持,有效提升了医学智能问答质量和医学知识服务效果。 展开更多
关键词 语言模型 知识图谱 医学问答 知识溯源 知识服务
下载PDF
基于文献和知识学习的重症医学大语言模型探索
13
作者 朱雯 李亚光 +1 位作者 李喆 周翔 《中国数字医学》 2024年第3期36-41,共6页
目的:通过大语言模型技术学习重症医学专科的临床知识,理解和识别临床医疗需求和临床问题意图,并对临床用户提出的问题进行智能反馈。方法:在通用大语言模型的基础上,进行医疗大语言模型数据集的设计,并收集大量的医学知识数据进行多任... 目的:通过大语言模型技术学习重症医学专科的临床知识,理解和识别临床医疗需求和临床问题意图,并对临床用户提出的问题进行智能反馈。方法:在通用大语言模型的基础上,进行医疗大语言模型数据集的设计,并收集大量的医学知识数据进行多任务多阶段的大语言模型训练,实现对重症医学临床信息的智能分析。结果:实现对重症医学临床医疗信息的智能化理解及自动化问答。结论:应用医疗大语言模型技术,结合临床规则库、医学文献等外部知识体系,可构建重症临床信息大语言模型系统,为临床医疗提供科学、智能的信息理解和决策支持,为大语言模型技术在医疗领域的进一步研究和应用提供经验和参考。 展开更多
关键词 语言模型 重症医疗 数据整合 智能分析
下载PDF
基于大语言模型的BIM正向设计问答系统研究
14
作者 丁志坤 李金泽 刘明辉 《土木工程与管理学报》 2024年第1期1-7,12,共8页
在正向设计中,设计人员能够通过BIM技术进行设计和管理建筑项目,以支持决策。然而,BIM正向设计过程中的信息处理和知识共享仍面临诸多挑战,尤其是在快速获取和应用复杂建筑规范及设计知识方面。为解决上述问题,本研究基于大语言模型(LLM... 在正向设计中,设计人员能够通过BIM技术进行设计和管理建筑项目,以支持决策。然而,BIM正向设计过程中的信息处理和知识共享仍面临诸多挑战,尤其是在快速获取和应用复杂建筑规范及设计知识方面。为解决上述问题,本研究基于大语言模型(LLM)设计了一套BIM正向设计问答系统,旨在探究LLM在BIM正向设计场景中的实际应用。通过采用基于QLoRA的LLM微调方式提高模型的专业性,并构建本地知识库形成问答系统,最后设计评价指标对系统进行主客观性能评估、专业问答对比分析。实验结果表明,该系统在专业领域性能表现良好,并能根据特定设计场景生成建议和解决方案,验证了本系统的可行性和优越性。 展开更多
关键词 正向设计 BIM 语言模型 专业问答
下载PDF
大语言模型在学科知识图谱自动化构建上的应用
15
作者 唐晓晟 程琳雅 +1 位作者 张春红 朱新宁 《北京邮电大学学报(社会科学版)》 2024年第1期125-136,共12页
人工智能技术的飞速发展推动了教育领域的智能化,涌现出一些利用知识图谱技术进行学科知识体系构建的研究。利用知识图谱构建的知识体系,可以建模知识点之间的关联性,形成课程知识脉络,有助于学习者对知识点的记忆与深层次理解。然而,... 人工智能技术的飞速发展推动了教育领域的智能化,涌现出一些利用知识图谱技术进行学科知识体系构建的研究。利用知识图谱构建的知识体系,可以建模知识点之间的关联性,形成课程知识脉络,有助于学习者对知识点的记忆与深层次理解。然而,学科课程的教学资源多样且分散,现有的自动构建方法往往使用单一的数据资源,资源利用率低,难以对专业知识体系的构建提供有效指导。构建方法自动化程度较低,构建成本大,需要开发不同的模块对非结构化文本进行处理并生成图谱,可复现性和可移植性较差。因此,提出了一种基于大语言模型的学科知识图谱构建优化流程,高度融合大语言模型的优势和各学科知识的逻辑关联。具体以通信专业为例,借用ChatGPT大语言模型的强大功能,使用多种知识来源,通过学科知识分析设计知识系统本体,自动化提取基于教学资源的知识实体和知识关系形成最终的学科知识体系,可方便地推广至其他学科领域。 展开更多
关键词 语言模型 知识图谱 智能化教育 ChatGPT 自动化图谱构建
下载PDF
基于大语言模型的水工程调度知识图谱的构建与应用
16
作者 冯钧 畅阳红 +3 位作者 陆佳民 唐海麟 吕志鹏 邱钰淳 《计算机科学与探索》 CSCD 北大核心 2024年第6期1637-1647,共11页
随着水利事业的发展和信息化需求的增加,处理和表示海量水利数据变得复杂而繁琐。特别是调度文本数据通常以自然语言的形式存在,缺乏明确的结构和规范,并且处理和应用这些多样性的数据需要具备广泛的领域知识和专业背景。为此,提出了基... 随着水利事业的发展和信息化需求的增加,处理和表示海量水利数据变得复杂而繁琐。特别是调度文本数据通常以自然语言的形式存在,缺乏明确的结构和规范,并且处理和应用这些多样性的数据需要具备广泛的领域知识和专业背景。为此,提出了基于大语言模型的水工程调度知识图谱的构建方法。通过数据层的调度规则数据收集与预处理,再利用大语言模型挖掘和抽取数据中蕴藏的知识,完成概念层本体构建和实例层“三步法”提示策略抽取。在数据层、概念层、实例层的相互作用下,实现了规则文本的高性能抽取,完成了数据集和知识图谱的构建。实验结果表明,大语言模型抽取方法F1值达到85.5%,且通过消融实验验证了模型各模块的有效性和合理性。构建的水工程调度知识图谱整合了分散的水利规则信息,有效处理非结构化文本数据,并提供可视化查询和功能追溯功能。这有助于领域从业人员判断来水情况并选择适当的调度方案,为水利决策和智能推荐等提供了重要支持。 展开更多
关键词 知识图谱 语言模型(LLM) 本体构建 知识抽取 水工程调度
下载PDF
基于大语言模型的个性化实验报告评语自动生成与应用
17
作者 翟洁 李艳豪 +1 位作者 李彬彬 郭卫斌 《计算机工程》 CAS CSCD 北大核心 2024年第7期42-52,共11页
在计算机实验报告评阅过程中,不同的实验报告评价体系呈现出多样性和差异性,固化的实验评语模板缺乏个性化的内容,评价结果往往未给出可解释性的依据。针对以上问题,提出基于大语言模型的个性化实验报告评语自动生成框架。通过主题-评... 在计算机实验报告评阅过程中,不同的实验报告评价体系呈现出多样性和差异性,固化的实验评语模板缺乏个性化的内容,评价结果往往未给出可解释性的依据。针对以上问题,提出基于大语言模型的个性化实验报告评语自动生成框架。通过主题-评估决策-集成提示策略,从教师的实验需求、代码质量需求中抽取该实验特有的评价体系,形成评估决策树,构建计算机软件方向课程共享的评估决策树库。设计基于大语言模型和决策树的实验要求、代码质量主题评级方法,从评估决策树库检索匹配学生实验报告内容的评估决策树,结合实验报告和代码文本,自动生成实验主题、代码质量主题定量或定性的评级结果及对应的可解释性依据。在实验报告模板中融入学生已完成的实验任务、主题评级结果、评价依据等,生成个性化的实验评语。实验结果表明,基于主题-评估决策-集成提示策略的决策树生成结果明显优于未用提示的方法,该策略各部分具有一定的有效性和合理性,同时自动生成的评级结果和教师原先批阅的评阅结果对比,软件测试、面向对象程序设计、电商金融课程示例匹配正确率均达到90%以上。从任课教师对于自动生成的评语评分分析,评语在流畅性、相关性、合理性3个维度上达到了较高的质量水平。 展开更多
关键词 语言模型 实验评估决策树 个性化 评语自动生成 代码质量评价
下载PDF
大语言模型下文化认同的发生、型构与再序
18
作者 余乃忠 宫曼露 《江海学刊》 北大核心 2024年第3期51-59,共9页
文化认同是塑造民族共同体、维护国家统一的心理基础,也是推动世界文化多样化、构建人类命运共同体的实践路径。随着信息技术带来的时空延伸和文化全球化加速演进,大语言模型成为文化信息代谢的重要器官,也是文化认同产生、深化和发展... 文化认同是塑造民族共同体、维护国家统一的心理基础,也是推动世界文化多样化、构建人类命运共同体的实践路径。随着信息技术带来的时空延伸和文化全球化加速演进,大语言模型成为文化信息代谢的重要器官,也是文化认同产生、深化和发展的重要媒介。在大语言模型迭代发展的背景下,从介质、技术和主体角度理解文化认同的发生局域,从基因、情感和能量角度挖掘文化认同的价值局域,从认知、算法和场景角度研究文化认同的实践局域,可推动文化认同广泛形成、价值实现和再造转化,有效防止信息共享传播中的文化霸权发展、信息失衡加剧、意识形态渗透等问题,为全球文化多样性发展凝聚人类共识。 展开更多
关键词 语言模型 文化认同 语言载体 信息技术 价值共识
下载PDF
领域大语言模型下的古籍词性标注应用研究
19
作者 朱丹浩 赵志枭 +3 位作者 胡蝶 赵文华 孙光耀 王东波 《科技情报研究》 2024年第2期21-29,共9页
[目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据... [目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。 展开更多
关键词 语言模型 “荀子”大模型 《左传》 词性标注 指令微调
下载PDF
CINOSUM:面向多民族低资源语言的抽取式摘要模型
20
作者 翁彧 罗皓予 +3 位作者 超木日力格 刘轩 董俊 刘征 《计算机科学》 CSCD 北大核心 2024年第7期296-302,共7页
针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效... 针对现有的模型无法处理多民族低资源语言自动摘要生成的问题,基于CINO提出了一种面向多民族低资源语言的抽取式摘要模型CINOSUM。为扩大文本摘要的语言范围,首先构建了多种民族语言的摘要数据集MESUM。为解决以往模型在低资源语言上效果不佳的问题,构建了一个框架,采用统一的句子抽取器,以进行不同民族语言的抽取式摘要生成。此外,提出采用多语言数据集的联合训练方法,旨在弥补知识获取上的不足,进而扩展在低资源语言上的应用,显著增强模型的适应性与灵活性。最终,在MESUM数据集上开展了广泛的实验研究,实验结果表明CINOSUM模型在包括藏语和维吾尔语在内的多民族低资源语言环境中表现卓越,并且在ROUGE评价体系下取得了显著的性能提升。 展开更多
关键词 抽取式摘要 语言预训练模型 低资源语言信息处理 知识迁移
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部