基于大语言模型的教育文本幂等摘要方法

Large Language Model-based Idempotent Summarization Method for Educational Text

下载PDF

导出

摘要大语言模型在自然语言处理领域蓬勃发展,但在教育数字化领域应用过程中仍面临一系列重要挑战。针对教育数字化领域垂域数据稀缺、摘要长度不稳定导致信息缺失或冗余的问题,提出一种用于教育领域文本摘要的轻量化幂等模型框架IGLM。该模型首先采用多源训练进行自适应扩增以提升数据多样性,然后对下游的文本摘要任务进行多种微调。同时,为降低文本长度的影响,设计幂等摘要生成策略拉近初次摘要与幂等摘要来约束模型,减少语料分布不均导致的偏见,结合量化技术在低资源条件下生成更为精确和流畅的摘要文本。实验以ROUGE分数为评估指标,在公开中文文本摘要数据集LCSTS、EDUCATION、NLPCC上进行验证。实验结果表明,该框架在生成摘要的准确率和流畅性上有明显提升,其中ROUGE-1/2/L相较基线模型在LCSTS数据集上分别提升7.9、7.4、8.7个百分点,在EDUCATION数据集上分别提升12.9、15.4、15.7个百分点,在NLPCC数据集上分别提升12.2、11.7、12.7个百分点,验证了模型有效性。 Large Language Models(LLMs)are currently undergoing vigorous development in the field of Natural Language Processing(NLP).However,significant challenges remain in their applications to educational digitization.To address the problem posed by the scarcity of domain-specific data and the instability of summarization leading to information loss or redundancy,this study introduces a lightweight idempotent model framework,Idempotent Generative Language Model(IGLM),for educational text summarization.The model first employs multisource training for adaptive augmentation to enhance data diversity.Subsequently,various finetuning procedures are applied to the downstream text summarization task.Concurrently,an idempotent summarization generation strategy is designed to mitigate the impact of text length.This strategy brings the summaries closer to idempotent form,constrains the model,mitigates biases resulting from uneven language corpora,and combines quantization techniques to generate more precise and fluent summaries under low-resource conditions.The experiments used Recall-Oriented Understudy for Gisting Evaluation(ROUGE)scores as the evaluation metric and validated the model on publicly available Chinese text summarization datasets Large-scale Chinese Short Text Summarization(LCSTS),EDUCATION,and Natural Language Processing and Chinese Computing(NLPCC).The results revealed significant enhancements in precision and coherence within this framework.Specifically,compared to the baseline model,the ROUGE-1/2/L scores were improved by 7.9,7.4,and 8.7 percentage points on the LCSTS dataset.Moreover,on the EDUCATION dataset,the scores exhibited enhancements of 12.9,15.4,and 15.7 percentage points for ROUGE-1/2/L.Similarly,on the NLPCC dataset,improvements of 12.2,11.7,and 12.7 percentage points were observed for ROUGE-1/2/L.This validation confirms the model's effectiveness.

作者杨兴睿马斌李森垚钟忺 YANG Xingrui;MA Bin;LI Senyao;ZHONG Xian(School of Computer Science and Artificial Intelligence,Wuhan University of Technology,Wuhan 430070,Hubei,China;Informatization Office,Wuhan University of Technology,Wuhan 430070,Hubei,China)

机构地区武汉理工大学计算机与人工智能学院武汉理工大学信息化办公室

出处《计算机工程》 CAS CSCD 北大核心 2024年第7期32-41,共10页 Computer Engineering

基金国家自然科学基金(62271361)。

关键词教育数字化文本摘要大语言模型低资源场景幂等扩增 educational digitalization text summarization Large Language Model(LLM) low-resource scenarios idempotent augmentation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1严昊,刘禹良,金连文,白翔.类ChatGPT大模型发展、应用和前景[J].中国图象图形学报,2023,28(9):2749-2762. 被引量：17
2吴砥,李环,陈旭.人工智能通用大模型教育应用影响探析[J].开放教育研究,2023,29(2):19-25. 被引量：96
3刘金硕,刘宁.面向招标文件的半结构化文本自动生成[J].计算机工程,2023,49(3):67-72. 被引量：1
4李健智,王红玲,王中卿.基于场景与对话结构的摘要生成研究[J].计算机工程,2023,49(4):303-311. 被引量：1
5高玮军,刘健,毛文静.基于T-HDGN模型的对话摘要生成方法[J].计算机工程,2023,49(10):80-88. 被引量：1
6杨涛,解庆,刘永坚,刘平峰.主题感知的长文本自动摘要算法[J].计算机工程与应用,2022,58(20):165-173. 被引量：1
7张克君,李伟男,钱榕,史泰猛,焦萌.基于深度学习的文本自动摘要方案[J].计算机应用,2019,39(2):311-315. 被引量：11

二级参考文献30

1刘挺,吴岩,王开铸.自动文摘综述[J].情报科学,1998,16(1):63-69. 被引量：10
2王红玲,周国栋,朱巧明.面向冗余度控制的中文多文档自动文摘[J].中文信息学报,2012,26(2):92-96. 被引量：6
3黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：399
4赵国朕,宋金晶,葛燕,刘永进,姚林,文涛.基于生理大数据的情绪识别研究进展[J].计算机研究与发展,2016,53(1):80-92. 被引量：45
5陈海建,戴永辉,韩冬梅,冯彦杰,黄河笑.开放式教学下的学习者画像及个性化教学探讨[J].开放教育研究,2017,23(3):105-112. 被引量：88
6王子璇,乐小虬,何远标.基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究[J].数据分析与知识发现,2017,1(4):1-8. 被引量：12
7吴西竹,周志华.领域知识指导的模型重用[J].中国科学：信息科学,2017,47(11):1483-1492. 被引量：5
8乔惠,肖君.基于xAPI的开放学习者行为分析模型研究[J].电化教育研究,2018,39(4):32-37. 被引量：14
9钱颖一.批判性思维与创造性思维教育:理念与实践[J].清华大学教育研究,2018,39(4):1-16. 被引量：173
10徐馨韬,柴小丽,谢彬,沈晨,王敬平.基于改进TextRank算法的中文文本摘要提取[J].计算机工程,2019,45(3):273-277. 被引量：24

共引文献120

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2董志勇,邱瀚,陈泓运.智慧高速系统中大语言模型的集成与应用研究[J].中国交通信息化,2024(S01):67-71.
3廖仲尼,张伟.人工智能+教育课堂教学改革新路径探索[J].创新创业理论研究与实践,2024(2):54-56. 被引量：2
4陈勇.大模型时代中小学生信息意识培养的挑战与应对[J].教育传播与技术,2023(6):12-17.
5梁治钢,王一敏.深度学习在电子病历抗菌药物使用方法分类中的应用[J].计算机系统应用,2019,28(8):71-77. 被引量：4
6尹诗,侯国莲,于晓东,李宁,王其乐,弓林娟.基于Bi-RNN的风电机组主轴承温度预警方法研究[J].郑州大学学报（工学版）,2019,40(5):44-50. 被引量：18
7丁建立,李洋,王家亮.基于双编码器的短文本自动摘要方法[J].计算机应用,2019,39(12):3476-3481. 被引量：4
8黄炜,黄建桥,李岳峰.基于BiLSTM-CRF的涉恐信息实体识别模型研究[J].情报杂志,2019,38(12):149-156. 被引量：24
9李鑫,王世坤.要素式审判的理论分析与智能化系统研发[J].武汉科技大学学报（社会科学版）,2020,22(3):323-334. 被引量：17
10陈天池,洪沛,杨国锋.基于深度学习的生成式自动摘要技术[J].数字技术与应用,2020,38(12):77-79. 被引量：4

1朱世琴,苟文静,吕佳霖.睡美人文献的论文特征研究——以生物学领域为例[J].图书情报导刊,2024,9(5):44-53.
2田野,毛延生.智媒时代思想政治教育多模态话语建构的三维探赜[J].江苏科技大学学报（社会科学版）,2024,24(2):95-101.
3金虹.数据驱动下的高职教育管理模式创新内涵及实践策略[J].太原城市职业技术学院学报,2024(6):79-82.
4樊雄.教育信息化2.0下农村小规模小学混合式联片教研研究[J].学生·家长·社会,2022(21):0010-0012.
5付育翔.巧借体育竞赛,促进中职体育与健康教学质量[J].新教育时代电子杂志（学生版）,2020(1):171-171.
6陈晓霞,钟文素,郑宝群.声触诊组织成像量化技术评估类风湿关节炎活动性[J].中华关节外科杂志（电子版）,2024,18(1):54-59.
7刘禹廷.美国国际教育工作者协会(NAFSA)第76届年会观察[J].教育国际交流,2024(4):51-53.

计算机工程

2024年第7期

浏览历史

内容加载中请稍等...

基于大语言模型的教育文本幂等摘要方法

参考文献7

二级参考文献30

共引文献120

相关作者

相关机构

相关主题

浏览历史