增强提示学习的少样本文本分类方法被引量：2

Enhanced Prompt Learning for Few-shot Text Classification Method

下载PDF

导出

摘要针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 An enhanced prompt learning method(EPL4FTC)for few-shot text classification task is proposed.This algorithm first converts the text classification task into the form of prompt learning based on natural language inference.Thus,the implicit data enhancement is achieved based on the prior knowledge of pre-training language models and the algorithm is optimized by two losses with different granularities.Moreover,to capture the category information of specific downstream tasks,the triple loss is used for joint optimization.The masked-language model is incorporated as a regularizer to improve the generalization ability.Through the evaluation on four Chinese and three English text classification datasets,the experimental results show that the classification accuracy of the proposed EPL4FTC is significantly better than the other compared baselines.

作者李睿凡魏志宇范元涛叶书勤张光卫 LI Ruifan;WEI Zhiyu;FAN Yuantao;YE Shuqin;ZHANG Guangwei(School of Artificial Intelligence,Beijing University of Posts and Telecommunications,Beijing 100876;Engineering Research Center of Information Networks,Ministry of Education,Beijing 100876;Key Laboratory of Interactive Technology and Experience System,Ministry of Culture and Tourism,Beijing 100876;School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876)

机构地区北京邮电大学人工智能学院教育部信息网络工程研究中心交互技术与体验系统文化和旅游部重点实验室北京邮电大学计算机学院

出处《北京大学学报（自然科学版）》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页 Acta Scientiarum Naturalium Universitatis Pekinensis

基金国家自然科学基金(62076032)资助。

关键词预训练语言模型少样本学习文本分类提示学习三元组损失 pre-trained language model few-shot learning text classification prompt learning triplet loss

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献11

1白静,李霏,姬东鸿.基于注意力的BiLSTM-CNN中文微博立场检测模型[J].计算机应用与软件,2018,35(3):266-274. 被引量：33
2杨顺成,李彦,赵其峰.基于GCN和Bi-LSTM的微博立场检测方法[J].重庆理工大学学报（自然科学）,2020,34(6):167-173. 被引量：6
3何贤敏,李茂西,何彦青.基于孪生BERT网络的科技文献类目映射[J].计算机研究与发展,2021,58(8):1751-1760. 被引量：5
4李洋,孙宇晴,景维鹏.文本立场检测综述[J].计算机研究与发展,2021,58(11):2538-2557. 被引量：5
5杜林,许传淇.基于BERT的漏洞文本特征分类技术研究[J].信息安全研究,2023,9(7):687-692. 被引量：5
6Md.Anwar Hussen Wadud,M.F.Mridha,Jungpil Shin,Kamruddin Nur,Aloke Kumar Saha.Deep-BERT:Transfer Learning for Classifying Multilingual Offensive Texts on Social Media[J].Computer Systems Science & Engineering,2023,44(2):1775-1791. 被引量：2
7于碧辉,蔡兴业,魏靖烜.基于提示学习的小样本文本分类方法[J].计算机应用,2023,43(9):2735-2740. 被引量：4
8穆建媛,朱毅,周鑫柯,李云,强继朋,袁运浩.基于提示学习的中文短文本分类方法[J].中文信息学报,2023,37(7):82-90. 被引量：4
9蒲秋梅,黄方俐,王辉.基于BERT-LSTM模型的情感分析研究[J].中国电子科学研究院学报,2023,18(10):912-920. 被引量：3
10郝洁,彭庆龙,丛山,李姣,孙海霞.基于提示学习的医学量表问题文本多分类研究[J].中国循证医学杂志,2024,24(1):76-82. 被引量：2

引证文献2

1蒲秋梅,李辅德.基于提示微调的微博立场检测研究[J].中国电子科学研究院学报,2024,19(4):340-349.
2吴龙涛,黄李洲,黄凰,施加松.基于提示学习的生物恐怖威胁信息指纹零样本文本分类技术[J].防化研究,2024,3(3):63-71.

1王舒云.福建省乡村普惠性幼儿园保教质量现状与分析[J].福建教育学院学报,2023,24(12):114-117.

北京大学学报（自然科学版）

2024年第1期

浏览历史

内容加载中请稍等...

增强提示学习的少样本文本分类方法被引量：2

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

增强提示学习的少样本文本分类方法 被引量：2

同被引文献11

引证文献2

相关作者

相关机构

相关主题

浏览历史

增强提示学习的少样本文本分类方法被引量：2