基于提示学习增强BERT的理解能力

Prompt learning enhance the understanding ability of BERT

下载PDF

导出

摘要提示学习旨在利用提示模板减小语言模型的预训练任务和下游任务间的差距。其难点在于提示模板的设计,为此,文中在构造提示模板的过程中,提出一个通过自动搜索离散提示对连续提示优化的新方法。其中,自动搜索提示基于双向Transformer编码器(Bidirectional Encoder Representation from Transformers, BERT)的预训练任务掩码语言模型训练,连续提示优化是训练自动搜索输出的离散提示在连续空间内的映射张量,根据损失函数对提示模板进行训练。实验表明,在公共基准SuperGLUE中,基于提示学习的BERT相比于原始的BERT模型在准确率和F1值上均有显著的提升。 Prompt learning aims to reduce the gap between the pre-training task and the downstream task of the language model using prompt templates.The difficulty lies in the design of prompt templates.This paper proposes a new method for optimizing continuous prompts by automatically searching discrete prompts in the process of constructing prompt templates.The automatic search prompt is based on the Bidirectional Encoder Representation from Transformers(BERT)pre-trained task mask language model training.The continuous prompt optimization is to train the mapping tensor of the discrete prompt templates of the auto-search output in the continuous space.The prompt templates are trained according to the loss function.Experiments show that the prompt-based learning BERT in the public benchmark SuperGLUE shows significant improvements in accuracy and F1 values compared to the original BERT model.

作者陈亚当杨刚王铎霖余文斌 CHEN Ya-dang;YANG Gang;WANG Duo-lin;YU Wen-bin(School of Computer Science,Nanjing University of Information Science and Technology,Nanjing 210044,China;Engineering Research Center of Digital Forensics,Ministry of Education,Nanjing University of Information Science and Technology,Nanjing 210044,China)

机构地区南京信息工程大学计算机学院南京信息工程大学数字取证教育部工程研究中心

出处《信息技术》 2024年第6期87-93,共7页 Information Technology

基金国家自然科学基金(61802197)。

关键词提示学习双向Transformer编码器自然语言处理连续提示优化掩码语言模型 prompt learning Bidirectional Encoder Representation from Transformers natural language processing continuous prompt optimization mask language model

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1刘睿珩,叶霞,岳增营.面向自然语言处理任务的预训练模型综述[J].计算机应用,2021,41(5):1236-1246. 被引量：21
2万莹,孙连英,赵平,王金锋,涂帅.基于信息增强BERT的关系分类[J].中文信息学报,2021,35(3):69-77. 被引量：10
3王国泰,董晶晶,高杨,王乾.基于Bert预训练模型的虚假新闻文本检测[J].信息技术,2022,46(1):137-142. 被引量：2
4傅群超,王枞.用于文本分类的多探测任务语言模型微调[J].北京邮电大学学报,2019,42(6):76-83. 被引量：2
5韩纪东,李玉鑑.神经网络模型中灾难性遗忘研究的综述[J].北京工业大学学报,2021,47(5):551-564. 被引量：3
6罗贤昌,薛吟兴.基于BERT的提示学习实现软件需求精确分类[J].信息技术与网络安全,2022,41(2):39-45. 被引量：4
7陆晓蕾,倪斌.基于预训练语言模型的BERT-CNN多层级专利分类研究[J].中文信息学报,2021,35(11):70-79. 被引量：19
8周博学.一种基于先验知识的实体关系联合抽取模型[J].信息技术,2022,46(4):130-136. 被引量：1
9赵宏,傅兆阳,赵凡.基于BERT和层次化Attention的微博情感分析研究[J].计算机工程与应用,2022,58(5):156-162. 被引量：20
10余同瑞,金冉,韩晓臻,李家辉,郁婷.自然语言处理预训练模型的研究综述[J].计算机工程与应用,2020,56(23):12-22. 被引量：49

二级参考文献17

1刘乐.虚假新闻的危害、成因及治理办法[J].新闻传播,2019,0(21):21-22. 被引量：2
2丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10. 被引量：913
3何力,贾焰,韩伟红,谭霜,陈志坤.大规模层次分类问题研究及其进展[J].计算机学报,2012,35(10):2101-2115. 被引量：14
4李保利.基于类别层次结构的多层文本分类样本扩展策略[J].北京大学学报（自然科学版）,2015,51(2):357-366. 被引量：17
5姜春涛.运用图示法自动提取中文专利文本的语义信息[J].图书情报工作,2015,59(21):115-122. 被引量：9
6刘龙飞,杨亮,张绍武,林鸿飞.基于卷积神经网络的微博情感倾向性分析[J].中文信息学报,2015,29(6):159-165. 被引量：96
7刘峰,高赛,于碧辉,郭放达.基于Multi-head Attention和Bi-LSTM的实体关系分类[J].计算机系统应用,2019,28(6):118-124. 被引量：12
8宋睿,陈鑫,洪宇,张民.基于卷积循环神经网络的关系抽取[J].中文信息学报,2019,33(10):64-72. 被引量：15
9陈兴蜀,常天祐,王海舟,赵志龙,张杰.基于微博数据的“新冠肺炎疫情”舆情演化时空分析[J].四川大学学报（自然科学版）,2020,57(2):409-416. 被引量：87
10杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：102

共引文献119

1丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
2曹艳琴.基于深度学习的英语自然语言处理系统[J].系统仿真技术,2021,17(4):285-288. 被引量：1
3张恒源,李大卫,安佳宁,刘洋.面向汉语学习者的作文自动评分系统设计与实现[J].电子技术与软件工程,2020(21):127-130. 被引量：1
4王亚珅.2020年深度学习技术发展综述[J].无人系统技术,2021,4(2):1-7. 被引量：3
5黄忠祥,李明.BiGRU结合注意力机制的文本分类研究[J].北京联合大学学报,2021,35(3):47-52. 被引量：2
6刘畅,阿布都克力木·阿布力孜,姚登峰,哈里旦木·阿布都克里木.维吾尔语形态分析研究综述[J].计算机工程与应用,2021,57(15):42-61. 被引量：3
7陈德光,马金林,马自萍,周洁.自然语言处理预训练技术综述[J].计算机科学与探索,2021,15(8):1359-1389. 被引量：35
8张世同.基于BERT与BiLSTM的铁路安监文本分类方法[J].现代计算机,2021,27(22):38-42. 被引量：3
9沈宙锋,苏前敏,郭晶磊.基于XLNet-BiLSTM的中文电子病历命名实体识别方法[J].智能计算机与应用,2021,11(8):97-102. 被引量：7
10陈国心.基于自然语言处理的评教文本分类与分析[J].西安航空学院学报,2021,39(3):91-96.

1廖列法,夏卫欢,杨翌虢.基于句法依赖增强图的方面级情感分析[J].计算机工程与设计,2024,45(6):1857-1864.

信息技术

2024年第6期

浏览历史

内容加载中请稍等...

基于提示学习增强BERT的理解能力

参考文献10

二级参考文献17

共引文献119

相关作者

相关机构

相关主题

浏览历史