基于提示学习的中文短文本分类方法被引量：1

Chinese Short Text Classification Based on Prompt Learning

下载PDF

导出

摘要伴随着互联网的飞速发展,产生了海量以微博、推特等为代表的少于100字的短文本数据,这些文本长度极短、特征稀疏、语义不足,因此给短文本分类问题带来了巨大挑战。现有的中文短文本分类方法往往需要大量的有标签或无标签的数据,但在实际应用中,大量的训练数据往往难以获取,且成本很高。为此,该文提出了一种基于提示学习的中文短文本分类方法,适用于少样本状况下的短文本分类。实验结果表明,该方法在仅使用少样本训练数据的情况下比使用大量训练数据的其他模型表现更好。具体来说,该文手工设计了模板,将使用了模板的原始数据替换为含有mask的文本作为新的输入,最终取得了较好的分类效果。通过对4个基准数据集进行验证,基于提示学习的分类方法在仅有40个训练样本的情况下比BERT预训练语言模型使用740个样本的准确率高出近6%。 With the rapid development of the Internet,a large number of short texts no more than 100 words have emerged on Weibo and Twitter in recent years.In contrast to the existing Chinese short text classification methods demanding a large amount of labeled or unlabeled training data,this paper proposes a Chinese short text classification method based on prompt learning,which achieved excellent performance in few-shot scenarios.Specifically,we manually design many templates to replace the original data with masks as new input.Experiments on four benchmark data sets show that,our proposed method with 40 training samples has nearly 6%higher accuracy than the pre-train language model(e.g.BERT)using 740 samples.

作者穆建媛朱毅周鑫柯李云强继朋袁运浩 MU Jianyuan;ZHU Yi;ZHOU Xinke;LI Yun;QIANG Jipeng;YUAN Yunhao(Department of Computer Science and Technology,Yangzhou University,Yangzhou,Jiangsu 225127,China)

机构地区扬州大学计算机科学与技术系

出处《中文信息学报》 CSCD 北大核心 2023年第7期82-90,共9页 Journal of Chinese Information Processing

基金国家自然科学基金(61906060,62076217)。

关键词短文本分类提示学习少样本 short text classification prompt learning few shot

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献12

1田宝明,戴新宇,陈家骏.一种基于随机森林的多视角文本分类方法[J].中文信息学报,2009,23(4):48-54. 被引量：8
2赵明,杜会芳,董翠翠,陈长松.基于word2vec和LSTM的饮食健康文本分类研究[J].农业机械学报,2017,48(10):202-208. 被引量：42
3刘浩然,丁攀,郭长江,常金凤,崔静闯.基于贝叶斯算法的中文垃圾邮件过滤系统研究[J].通信学报,2018,39(12):151-159. 被引量：14
4刘壮,刘畅,Wayne Lin,赵军.用于金融文本挖掘的多任务学习预训练金融语言模型[J].计算机研究与发展,2021,58(8):1761-1772. 被引量：9
5张玉洁,白如江,刘明月,于纯良.融合语义联想和BERT的图情领域SAO短文本分类研究[J].图书情报工作,2021,65(16):118-129. 被引量：9
6潘瑞东,孔维健,齐洁.基于预训练模型与知识蒸馏的法律判决预测算法[J].控制与决策,2022,37(1):67-76. 被引量：8
7熊伟,宫禹.基于元学习的不平衡少样本情况下的文本分类研究[J].中文信息学报,2022,36(1):104-116. 被引量：4
8黄友文,魏国庆,胡燕芳.DistillBIGRU:基于知识蒸馏的文本分类模型[J].中文信息学报,2022,36(4):81-89. 被引量：2
9邵仁荣,刘宇昂,张伟,王骏.深度学习中知识蒸馏研究综述[J].计算机学报,2022,45(8):1638-1673. 被引量：18
10祁瑞华,邵震,关菁华,郭旭.基于MPNet预训练和多头注意力特征融合的引文意图分类方法[J].模式识别与人工智能,2022,35(9):849-857. 被引量：1

引证文献1

1王润周,张新生,王明虎.融合动态掩码注意力与多教师多特征知识蒸馏的文本分类[J].中文信息学报,2024,38(3):113-129.

1赵志杰,张艳艳,毛翔宇.基于改进Adam优化算法的中文短文本分类方法[J].电子测量技术,2022,45(23):132-138. 被引量：3
2李攀,吴亚东,褚琦凯,张贵宇,付朝帅.基于多卷积核字词特征的中文短文本分类方法[J].四川轻化工大学学报（自然科学版）,2023,36(1):73-83.
3盛蒙蒙,史建晖,沈立峰.基于CBA算法的恶意URL检测[J].数字技术与应用,2023,41(10):9-13.
4郑小丽,王巍,张闯,杜雨晅.融合对比学习的图神经网络会话推荐模型[J].应用科技,2023,50(5):8-16.
5吴磊,韩华,黄丽,A.A.M.Muzahid.面向长尾图像的个性化专家识别算法[J].电光与控制,2023,30(11):62-66.
6张嘉琪,徐啟蕾.基于NAM-YOLO网络的苹果缺陷检测算法[J].计算机与现代化,2023(10):53-58.
7杨永清,范承昊,张媛媛.基于视知觉理论的社交媒体用户参与行为研究[J].山东工商学院学报,2023,37(5):36-47. 被引量：1
8杨弦,王智慧,吴江宁.奖励政策对不同用户群体在线评论效价和质量的影响研究[J].计量经济学报,2023,3(3):872-885.
9周璇,伍星.一种基于可验证加密的认证算法安全验证方法[J].江西科学,2023,41(5):977-984.
10梁迪,卢列兆.基于不确定相似性度量学习的三维模型草图检索[J].沈阳大学学报（自然科学版）,2023,35(5):406-413.

中文信息学报

2023年第7期

浏览历史

内容加载中请稍等...

基于提示学习的中文短文本分类方法被引量：1

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于提示学习的中文短文本分类方法 被引量：1

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于提示学习的中文短文本分类方法被引量：1