-
题名采用低秩编码优化大语言模型的高校基础知识问答研究
- 1
-
-
作者
骆仕杰
金日泽
韩抒真
-
机构
天津工业大学网络安全和信息化办公室
天津工业大学软件学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第8期2156-2168,共13页
-
基金
国家自然科学基金(61806142)
天津市科学技术局项目(19PTZWHZ00020)
+1 种基金
中国学位与研究生教育学会项目(2020MSA50)
产学合作协同育人项目(202102084059)。
-
文摘
在高等教育领域,基础知识问答系统对学生学术成就提升及教育资源公平分配具有重要作用。近年来已有基于预训练语言模型上使用机器阅读理解和文本相似度匹配的问答技术,在处理复杂的自然语言问题时仍然面临因训练数据不足、模型泛化能力限制等瓶颈导致的回答质量和准确性不足的情况。本研究旨在解决如何在降低资源消耗的同时,提升基础知识问答系统在高校环境中的性能优势和准确率。为实现该目标,提出了一种高校基础知识领域的低秩编码大语言模型微调方法。该方法通过低秩编码的方法降低大语言模型的内存、显存在训练和预测的消耗量,并且运用大语言模型的生成式方法优化我校基础知识数据问答领域的研究与分析,从而提高日常基础知识问答的质量、准确性和响应速度。通过冻结大型预训练模型权重,将高校基础知识语言信息融入原Transformer架构的预训练层,并且加入了问答优化模块来规范生成式模型的准确性。此方法在显著减少下游任务可训练参数数量的同时,可以较好地保留原模型的生成式语言能力,并且针对高校基础知识领域展现出更优的性能优势和准确率。
-
关键词
生成式语言模型
基础知识问答
大语言模型
TRANSFORMER
冻结模型权重
-
Keywords
generative language model
fundamental knowledge question-answering
large language model
Transformer
freezing model weights
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合随机森林和神经网络的教学质量分析算法
- 2
-
-
作者
骆仕杰
韩抒真
-
机构
天津工业大学网络安全和信息化办公室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第8期1686-1692,共7页
-
基金
中国学位与研究生教育学会项目(2020MSA50)资助
产学合作协同育人项目(202102084059)资助
天津市教育委员会项目(2019KJ030)资助。
-
文摘
为了实现更好的教学质量分析,分析教学过程中存在的不足,提高高校教学质量,设计了一种融合师资信息、学生信息和教学信息的教学质量分析模型(RALCA).使用随机森林(RF)算法将教师与学生信息的特征重要性、特征与目标变量之间的关系性进行度量表示,运用准确的分类效果筛选保留下来最优的特征子集.使用自注意力机制的长短记忆神经网络(Attention-LSTM)融合教师、学生信息画像特征和教学信息特征,将关联信息更深层次的挖掘,获得高精度的教学质量影响因素之间的关系分析结果.根据实验对比分析表明,提出的RALCA模型可以更科学地分析现阶段影响教学质量的影响因素高低排序,高校可以获得更有效的教学质量分析来提升教学质量.
-
关键词
随机森林
自注意力机制神经网络
用户画像
特征融合
教学质量分析
-
Keywords
random forest
self-attention neural network
user portrait
feature fusion
teaching quality analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-