基于提示学习的小样本文本分类方法被引量：4

Few-shot text classification method based on prompt learning

下载PDF

导出

摘要文本分类任务通常依赖足量的标注数据,针对低资源场景下的分类模型在小样本上的过拟合问题,提出一种基于提示学习的小样本文本分类方法BERT-P-Tuning。首先,利用预训练模型BERT(Bidirectional Encoder Representations from Transformers)在标注样本上学习到最优的提示模板;然后,在每条样本中补充提示模板和空缺,将文本分类任务转化为完形填空任务;最后,通过预测空缺位置概率最高的词并结合它与标签之间的映射关系得到最终的标签。在公开数据集FewCLUE上的短文本分类任务上进行实验,实验结果表明,所提方法相较于基于BERT微调的方法在评价指标上有显著提高。所提方法在二分类任务上的准确率与F1值分别提升了25.2和26.7个百分点,在多分类任务上的准确率与F1值分别提升了6.6和8.0个百分点。相较于手动构建模板的PET(Pattern Exploiting Training)方法,所提方法在两个任务上的准确率分别提升了2.9和2.8个百分点,F1值分别提升了4.4和4.2个百分点,验证了预训练模型应用在小样本任务的有效性。 Text classification tasks usually rely on sufficient labeled data.Concerning the over-fitting problem of classification models on samples with small size in low resource scenarios,a few-shot text classification method based on prompt learning called BERT-P-Tuning was proposed.Firstly,the pre-trained model BERT(Bidirectional Encoder Representations from Transformers)was used to learn the optimal prompt template from labeled samples.Then,the prompt template and vacancy were filled in each sample,and the text classification task was transformed into the cloze test task.Finally,the final labels were obtained by predicting the word with the highest probability of the vacant positions and combining the mapping relationship between it and labels.Experimental results on the short text classification tasks of public dataset FewCLUE show that the proposed method have significantly improved the evaluation indicators compared to the BERT fine-tuning based method.In specific,the proposed method has the accuracy and F1 score increased by 25.2 and 26.7 percentage points respectively on the binary classification task,and the proposed method has the accuracy and F1 score increased by 6.6 and 8.0 percentage points respectively on the multi-class classification task.Compared with the PET(Pattern Exploiting Training)method of constructing templates manually,the proposed method has the accuracy increased by 2.9 and 2.8 percentage points respectively on two tasks,and the F1 score increased by 4.4 and 4.2 percentage points respectively on two tasks.The above verifies the effectiveness of applying pre-trained model on few-shot tasks.

作者于碧辉蔡兴业魏靖烜 YU Bihui;CAI Xingye;WEI Jingxuan(University of Chinese Academy of Sciences,Beijing 100049,China;Shenyang Institute of Computing Technology,Chinese Academy of Sciences,Shenyang Liaoning 110168,China)

机构地区中国科学院大学中国科学院沈阳计算技术研究所

出处《计算机应用》 CSCD 北大核心 2023年第9期2735-2740,共6页 journal of Computer Applications

基金国家重点研发计划项目(2019YFB1405803)。

关键词小样本学习文本分类预训练模型提示学习自适应模板 few-shot learning text classification pre-trained model prompt learning adaptive template

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵凯琳,靳小龙,王元卓.小样本学习研究综述[J].软件学报,2021,32(2):349-369. 被引量：152
2李凡长,刘洋,吴鹏翔,董方,蔡奇,王哲.元学习研究综述[J].计算机学报,2021,44(2):422-446. 被引量：68
3李舟军,范宇,吴贤杰.面向自然语言处理的预训练技术研究综述[J].计算机科学,2020,47(3):162-173. 被引量：112

二级参考文献34

1张庆林,王永明.元学习能力及其培养[J].中国教育学刊,1996(3):34-37. 被引量：47
2朱方年,马野.拔除股动脉鞘管手法压迫与应用血管闭合装置的局部并发症小样本比较[J].现代中西医结合杂志,2010,19(14):1748-1748. 被引量：2
3陈武锦.半监督学习研究综述[J].电脑知识与技术,2011,7(6):3887-3889. 被引量：4
4杨军,刘妍丽.基于图像的单样本人脸识别研究进展[J].西华大学学报（自然科学版）,2014,33(4):1-5. 被引量：8
5沈媛媛,严严,王菡子.有监督的距离度量学习算法研究进展[J].自动化学报,2014,40(12):2673-2686. 被引量：24
6刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：134
7王雪,马铁民,杨涛,宋平,谢秋菊,陈争光.基于近红外光谱的灌浆期玉米籽粒水分小样本定量分析[J].农业工程学报,2018,34(13):203-210. 被引量：15
8刘鑫鹏,栾悉道,谢毓湘,黄明哲.迁移学习研究和算法综述[J].长沙大学学报,2018,32(5):28-31. 被引量：41
9刘健,袁谦,吴广,喻晓.卷积神经网络综述[J].计算机时代,2018(11):19-23. 被引量：31
10贾玲芝,秦蓉蓉,迟荣香,王吉华.基于小样本的护士核心能力评估研究[J].医药高职教育与现代护理,2018,1(6):340-342. 被引量：3

共引文献311

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
2丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
3徐惠灵,尚政国,董胜波,苏琪雅.面向深度神经网络应用的小样本学习技术研究[J].南京航空航天大学学报,2022,54(S01):80-86.
4尤庆丽,李国勇.基于孪生网络的离线手写签名鉴别算法[J].计算机应用,2023,43(S01):45-48.
5郭军成,万刚,胡欣杰,王帅,严发宝.基于少样本的太阳射电爆发事件检测研究[J].计算机科学,2022,49(S02):597-603.
6张烈平,李智浩,唐玉良.基于迁移学习的轻量化YOLOv2口罩佩戴检测方法[J].电子测量技术,2022,45(10):112-117. 被引量：9
7郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.
8卢洪.基于深度学习聚类算法的城市数据分类分级方法[J].工业技术创新,2021,8(4):73-78. 被引量：3
9郝志英,袁得嵛.基于迁移学习的小样本血腥暴力图片识别算法研究[J].中国人民公安大学学报（自然科学版）,2024,30(1):58-65.
10赵卫红.海洋中胶体研究的新进展[J].海洋与湖沼,2000,31(2):221-229. 被引量：11

同被引文献33

1王蓬辉,李明正,李思.基于数据增强的中文医疗命名实体识别[J].北京邮电大学学报,2020,43(5):84-90. 被引量：12
2杨笑宇,庞郑宁,樊启俊,冷喜武,朴林,李勇,李军.基于电力调度工作流构建运行管理的互联互通框架[J].电力系统自动化,2015,39(1):177-182. 被引量：20
3张晓华,刘道伟,李柏青,冯长有.智能全景系统概念及其在现代电网中的应用体系[J].中国电机工程学报,2019,39(10):2885-2894. 被引量：37
4余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：50
5余佳雨,李响,詹瑾瑜,江维,曹扬,杨瑞.基于EDA和回译的导游投诉文本混合增强方法[J].计算机技术与发展,2021,31(3):21-26. 被引量：2
6王骏东,杨军,裴洋舟,詹祥澎,周挺,谢培元.基于知识图谱的配电网故障辅助决策研究[J].电网技术,2021,45(6):2101-2112. 被引量：48
7陈德光,马金林,马自萍,周洁.自然语言处理预训练技术综述[J].计算机科学与探索,2021,15(8):1359-1389. 被引量：39
8何贤敏,李茂西,何彦青.基于孪生BERT网络的科技文献类目映射[J].计算机研究与发展,2021,58(8):1751-1760. 被引量：6
9杨秋勇,彭泽武,苏华权,邓伟民,张焕明,李梦诗.基于Bi-LSTM-CRF的中文电力实体识别[J].信息技术,2021,45(9):45-50. 被引量：17
10Hongping Wu,Yuling Liu,Jingwen Wang.Review of Text Classification Methods on Deep Learning[J].Computers, Materials & Continua,2020(6):1309-1321. 被引量：13

引证文献4

1顾勋勋,刘建平,邢嘉璐,任海玉.文本分类中Prompt Learning方法研究综述[J].计算机工程与应用,2024,60(11):50-61. 被引量：1
2田雪涵,董坤,赵剑锋,郭希瑞.基于增强优化预训练语言模型的电力数据实体识别方法[J].智慧电力,2024,52(6):100-107. 被引量：2
3余新言,曾诚,王乾,何鹏,丁晓玉.基于知识增强和提示学习的小样本新闻主题分类方法[J].计算机应用,2024,44(6):1767-1774. 被引量：1
4吴龙涛,黄李洲,黄凰,施加松.基于提示学习的生物恐怖威胁信息指纹零样本文本分类技术[J].防化研究,2024,3(3):63-71.

二级引证文献4

1王星,丁来国,刘超,张夕军,翟文彬,姚双龙,刘烨.基于大模型的智能家居语言交互研究[J].轻工标准与质量,2024(3):107-109. 被引量：1
2张榆浠,王静瑗.基于5G的智能电网异常入侵动态检测方法[J].通信电源技术,2024,41(16):149-151.
3苏易礌,李卫军,刘雪洋,丁建平,刘世侠,李浩南,李贯峰.基于图神经网络的文本分类方法研究综述[J].计算机工程与应用,2024,60(19):1-17.
4张金营,王哲峰,谢华,么长英,闵艳丽,王新颖.基于知识图谱与大语言模型的电力行业知识检索分析系统研发与应用[J].中国电力,2024,57(12):198-205.

计算机应用

2023年第9期

浏览历史

内容加载中请稍等...

基于提示学习的小样本文本分类方法被引量：4

参考文献3

二级参考文献34

共引文献311

同被引文献33

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于提示学习的小样本文本分类方法 被引量：4

参考文献3

二级参考文献34

共引文献311

同被引文献33

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于提示学习的小样本文本分类方法被引量：4