基于BERT-BiLSTM模型的短文本自动评分系统被引量：9

Short text automatic scoring system based on BERT-BiLSTM model

下载PDF

导出

摘要针对短文本自动评分中存在的特征稀疏、一词多义及上下文关联信息少等问题,提出一种基于BERT-BiLSTM(bidirectional encoder representations from transformers-bidirectional long short-term memory)的短文本自动评分模型.使用BERT(bidirectional encoder representations from transformers)语言模型预训练大规模语料库习得通用语言的语义特征,通过预训练好的BERT语言模型预微调下游具体任务的短文本数据集习得短文本的语义特征和关键词特定含义,再通过BiLSTM(bidirectional long short-term memory)捕获深层次上下文关联信息,最后将获得的特征向量输入Softmax回归模型进行自动评分.实验结果表明,对比CNN(convolutional neural networks)、CharCNN(character-level CNN)、LSTM(long short-term memory)和BERT等基准模型,基于BERT-BiLSTM的短文本自动评分模型所获的二次加权kappa系数平均值最优. Aiming at the problems of sparse features,polysemy of one word and less context related information in short text automatic scoring,a short text automatic scoring model based on bidirectional encoder representations from transformers-bidirectional long short-term memory(BERT-BiLSTM)is proposed.Firstly,the large-scale corpus is pre-trained with bidirectional encoder representations from transformers(BERT)language model to acquire the semantic features of the general language.Then the semantic features of short text and the semantics of keywords in a specific context are acquired through the short text data for the pre-fine tuning downstream specific tasks set prefined by BERT.And then the deep-seated context dependency is captured through bidirectional long short-term memory(BiLSTM).Finally,the obtained feature vectors are input into Softmax regression model for automatic scoring.The experimental results show that compared with other benchmark models of convolutional neural networks(CNN),character-level CNN(CharCNN),long short-term memory(LSTM)and BERT,the short text automatic scoring model based on BERT-BiLSTM achieves the best average value of quadratic weighted kappa coefficient.

作者夏林中叶剑锋罗德安管明祥刘俊曹雪梅 XIA Linzhong;YE Jianfeng;LUO De’an;GUAN Mingxiang;LIU Jun;CAO Xuemei(Engineering Applications of Artificial Intelligence Technology Laboratory,Shenzhen Institute of Information Technology,Shenzhen 518172,Guangdong Province,P.R.China)

机构地区深圳信息职业技术学院人工智能技术应用工程实验室

出处《深圳大学学报（理工版）》 CAS CSCD 北大核心 2022年第3期349-354,共6页 Journal of Shenzhen University(Science and Engineering)

基金广东省教育厅高校科研平台资助项目(2020KTSCX301) 深圳市基础研究计划资助项目(JCYJ20190808093001772) 国家高层次人才特殊支持计划领军人才(教学名师)资助项目(组厅字[2018]6号)。

关键词信号与信息处理自然语言处理 BERT语言模型短文本自动评分长短时记忆网络二次加权kappa系数 signal and information processing natural language processing BERT language model short text automatic scoring long short-term memory net quadratic weighted kappa coefficient

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] H08 [语言文字—语言学]

引文网络
相关文献

参考文献4

1刘欢,张智雄,王宇飞.BERT模型的主要优化改进方法研究综述[J].数据分析与知识发现,2021,5(1):3-15. 被引量：37
2方晓东,刘昌辉,王丽亚,殷兴.基于BERT的复合网络模型的中文文本分类[J].武汉工程大学学报,2020,42(6):688-692. 被引量：8
3段丹丹,唐加山,温勇,袁克海.基于BERT模型的中文短文本分类算法[J].计算机工程,2021,47(1):79-86. 被引量：82
4夏林中,罗德安,刘俊,管明祥,张振久,龚爱平.基于注意力机制的双层LSTM自动作文评分系统[J].深圳大学学报（理工版）,2020,37(6):559-566. 被引量：8

二级参考文献21

1刘小敏,王昊,李心蕾,邓三鸿.不同特征粒度在微博短文本分类中作用的比较研究[J].情报科学,2018,36(12):126-133. 被引量：10
2王文娟,马建霞,陈春,张凌波.引文文本分类与实现方法研究综述[J].图书情报工作,2016,60(6):118-127. 被引量：16
3李理,应三丛.基于FPGA的卷积神经网络Softmax层实现[J].现代计算机（中旬刊）,2017(9):21-24. 被引量：16
4孙昭颖,刘功申.面向短文本的神经网络聚类算法研究[J].计算机科学,2018,45(B06):392-395. 被引量：14
5高云龙,左万利,王英,王鑫.基于集成神经网络的短文本分类模型[J].吉林大学学报（理学版）,2018,56(4):933-938. 被引量：12
6郑亚南,田大钢.基于GloVe与SVM的文本分类研究[J].软件导刊,2018,17(6):45-48. 被引量：10
7陈巧红,王磊,孙麒,贾宇波.卷积神经网络的短文本分类方法[J].计算机系统应用,2019,28(5):137-142. 被引量：13
8冯勇,屈渤浩,徐红艳,王嵘冰,张永刚.融合TF-IDF和LDA的中文FastText短文本分类方法[J].应用科学学报,2019,37(3):378-388. 被引量：31
9汪岿,刘柏嵩.文本分类研究综述[J].数据通信,2019,0(3):37-47. 被引量：21
10吴小华,陈莉,魏甜甜,范婷婷.基于Self-Attention和Bi-LSTM的中文短文本情感分析[J].中文信息学报,2019,33(6):100-107. 被引量：54

共引文献126

1郭子晨,李昆阳,娄嘉鹏.基于深度学习的多通道多任务学习判决预测模型[J].北京电子科技学院学报,2022,30(4):105-114.
2李欣儒,贺超城,黄茜,吴江.多层信任视角下的共享服务平台用户预定行为研究[J].知识管理论坛,2023(2):140-154. 被引量：2
3徐维军,付志能,李茂昌,张卫国.基于新闻文本挖掘的股指期货高频预测研究[J].系统科学与数学,2021,41(7):1856-1875. 被引量：2
4黄家续,曾献辉,施陈俊.基于实时数据流特征提取的设备能耗异常识别算法研究[J].信息技术与网络安全,2021,40(5):45-50. 被引量：2
5胡蝶,邓璇.一种基于标题与摘要语义的学术论文推荐方法[J].数字技术与应用,2021,39(5):97-99. 被引量：1
6时伟,刘怀兴,程振宇,顾文冠.一体化应急应战体系能力评估关键指标提取技术框架研究[J].信息工程大学学报,2021,22(2):246-252. 被引量：2
7邢照野,刘晓群.基于改进ERNIE模型的中文文本分类方法[J].信息与电脑,2021,33(8):87-89. 被引量：4
8张萌萌,梁艳红.补充语义信息的多特征融合模糊文本分类[J].信息技术与信息化,2021(6):45-47. 被引量：1
9王永鹏,周晓磊,马慧敏,曹吉龙,无.联合知识的融合训练模型[J].计算机系统应用,2021,30(7):50-56. 被引量：1
10田沛霖,符海滕,马力禹,罗琳.融合对抗训练和CNN-BiGRU神经网络的新闻文本分类模型[J].图书情报导刊,2021,6(8):38-45. 被引量：3

同被引文献66

1谈国新,方一.突发公共事件网络舆情监测指标体系研究[J].华中师范大学学报（人文社会科学版）,2010,49(3):66-70. 被引量：112
2王青,成颖,巢乃鹏.网络舆情监测及预警指标体系构建研究[J].图书情报工作,2011,55(8):54-57. 被引量：92
3聂恩伦,陈黎,王亚强,秦湘清,金宇,于中华.基于K近邻的新话题热度预测算法[J].计算机科学,2012,39(B06):257-260. 被引量：31
4黄卫东,陈凌云,吴美蓉.网络舆情话题情感演化研究[J].情报杂志,2014,33(1):102-107. 被引量：36
5刘萌玥,陈效萱,吴建伟,赵玉宗,唐顺英.旅游景区网络舆情指标体系构建——基于蚂蜂窝网全国百家5A级景区的游客评论[J].资源开发与市场,2017,33(1):80-84. 被引量：37
6刘宏韬,刘伟,胡志刚.基于抽象语法树的数据泥团自动检测研究[J].计算机应用与软件,2017,34(1):15-20. 被引量：3
7江彤彤,成金勇,鹿文鹏.基于卷积神经网络多层特征提取的目标识别[J].计算机系统应用,2017,26(12):64-70. 被引量：12
8俞婷婷,徐彭娜,江育娥,林劼.基于改进的Jaccard系数文档相似度计算方法[J].计算机系统应用,2017,26(12):137-142. 被引量：31
9黄卿,谢合亮.机器学习方法在股指期货预测中的应用研究——基于BP神经网络、SVM和XGBoost的比较分析[J].数学的实践与认识,2018,48(8):297-307. 被引量：42
10曾子明,黄城莺.基于BP神经网络的突发传染病舆情热度趋势预测模型研究[J].现代情报,2018,38(5):37-44. 被引量：35

引证文献9

1肖国亮,马磊,袁峰,郭成锋.基于领域预训练的孪生网络智能评分方法[J].中国考试,2023(4):78-85. 被引量：3
2黎秋艳,刘佳祎,王鹏,王杰.基于GloVe-CNN算法的英语在线考试主观题自动评分模型[J].桂林理工大学学报,2023,43(1):155-160. 被引量：3
3徐倩,张雷,欧冬秀,贺云鹏.基于BERT-CNN的城轨列控车载设备故障分类[J].深圳大学学报（理工版）,2023,40(5):529-538. 被引量：1
4李嘉琦,钟紫凡,付阳辉,曾泽凡,成清.基于开源文本数据的目标跟踪方法[J].火力与指挥控制,2023,48(10):93-101. 被引量：1
5韩迪,郭维,廖凯,孙传一,汪勃澄,林坤玲.基于TBA融合模型的股票指数预测[J].深圳大学学报（理工版）,2023,40(6):665-673.
6千颖利.基于长短期记忆网络的英语标题自动生成[J].自动化技术与应用,2024,43(4):71-73.
7宫昀,华雪侠.基于多语法改错证据的英语语法校对[J].自动化技术与应用,2024,43(4):82-84.
8冯筠,栗凯旋,高志泽樟,黄立,孙霞.主观题自动评判算法研究综述[J].计算机科学,2024,51(10):33-39.
9饶丹,钟磊.基于BERT-BiLSTM模型的突发事件网络舆情热度预测[J].中国传媒科技,2024(12):46-49.

二级引证文献8

1肖国亮,马磊,袁峰,郭成锋,邢金宝.智能评分技术应用效果的评价研究[J].中国考试,2023(10):17-27. 被引量：2
2张慧琴,李中凯,徐玉林.高校富媒体在线考试的体系结构与全流程设计[J].现代信息科技,2024,8(8):40-44. 被引量：1
3廖石宝,陈强.基于深度学习的MLP-GRU复合模型简答题评分系统的设计[J].自动化应用,2024,65(8):232-236.
4任喜伟,杜丰怡,向启怀,李兆允,赵杉.基于RBBLA混合模型的文本相似度计算方法[J].陕西科技大学学报,2024,42(4):184-190.
5冯筠,栗凯旋,高志泽樟,黄立,孙霞.主观题自动评判算法研究综述[J].计算机科学,2024,51(10):33-39.
6赖治平,王旭,黄育尚,陈昌邦.基于多特征融合分析的设备故障状态智能分类方法[J].环境技术,2024,42(9):118-124.
7肖国亮,马磊,袁峰,邢金宝.人事考试与测评领域人工智能应用新探索[J].中国人事科学,2024(10):1-10.
8何秀楠,薛亚琴,陈晓红.基于文本过滤技术的多来源高校财务数据智能聚合方法[J].无线互联科技,2024,21(21):107-109.

1乔允裳.非常今年[J].七彩语文（初中）,2021(4):38-39.
2郑纬民.自然语言处理预训练模型专题导读[J].中兴通讯技术,2022,28(2):1-2.
3闪晓娟.英语教育对学生语言能力的重要性及提升对策[J].今天,2022(5):163-164.
4陈海波.数学与建筑[J].工业建筑,2021,51(12).
5高瀛.外宣翻译中建筑工程的西语例句的应用[J].工业建筑,2021,51(12).
6韩慧,周满江.高校大学英语教学中学生自学能力的现状研究[J].创新创业理论研究与实践,2021(18):24-26. 被引量：1
7舒敏敏.农村初中英语学困生成因及帮助策略研究[J].世纪之星—初中版,2021(13):71-72.
8无.激活数字服务平台给古籍注入新的生命力[J].广东印刷,2022(2):71-72.

深圳大学学报（理工版）

2022年第3期

浏览历史

内容加载中请稍等...

基于BERT-BiLSTM模型的短文本自动评分系统被引量：9

参考文献4

二级参考文献21

共引文献126

同被引文献66

引证文献9

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于BERT-BiLSTM模型的短文本自动评分系统 被引量：9

参考文献4

二级参考文献21

共引文献126

同被引文献66

引证文献9

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于BERT-BiLSTM模型的短文本自动评分系统被引量：9