融合BERT与标签语义注意力的文本多标签分类方法被引量：13

Text multi-label classification method incorporating BERT and label semantic attention

下载PDF

导出

摘要多标签文本分类(MLTC)是自然语言处理(NLP)领域的重要子课题之一。针对多个标签之间存在复杂关联性的问题,提出了一种融合BERT与标签语义注意力的MLTC方法TLA-BERT。首先,通过对自编码预训练模型进行微调,从而学习输入文本的上下文向量表示;然后,使用长短期记忆(LSTM)神经网络将标签进行单独编码;最后,利用注意力机制显性突出文本对每个标签的贡献,以预测多标签序列。实验结果表明,与基于序列生成模型(SGM)算法相比,所提出的方法在AAPD与RCV1-v2公开数据集上,F1值分别提高了2.8个百分点与1.5个百分点。 Multi-Label Text Classification(MLTC)is one of the important subtasks in the field of Natural Language Processing(NLP).In order to solve the problem of complex correlation between multiple labels,an MLTC method TLA-BERT was proposed by incorporating Bidirectional Encoder Representations from Transformers(BERT)and label semantic attention.Firstly,the contextual vector representation of the input text was learned by fine-tuning the self-coding pre-training model.Secondly,the labels were encoded individually by using Long Short-Term Memory(LSTM)neural network.Finally,the contribution of text to each label was explicitly highlighted with the use of an attention mechanism in order to predict the multi-label sequences.Experimental results show that compared with Sequence Generation Model(SGM)algorithm,the proposed method improves the F value by 2.8 percentage points and 1.5 percentage points on the Arxiv Academic Paper Dataset(AAPD)and Reuters Corpus Volume I(RCV1)-v2 public dataset respectively.

作者吕学强彭郴张乐董志安游新冬 LYU Xueqiang;PENG Chen;ZHANG Le;DONG Zhi’an;YOU Xindong(Beijing Key Laboratory of Internet Culture and Digital Dissemination Research(Beijing Information Science and Technology University),Beijing 100101,China)

机构地区网络文化与数字传播北京市重点实验室(北京信息科技大学)

出处《计算机应用》 CSCD 北大核心 2022年第1期57-63,共7页 journal of Computer Applications

基金北京市自然科学基金资助项目(4212020) 青海省藏文信息处理与机器翻译重点实验室/藏文信息处理教育部重点实验室开放课题基金资助项目(2019Z002)。

关键词多标签分类 BERT 标签语义信息双向长短期记忆神经网络注意力机制 multi-label classification Bidirectional Encoder Representations from Transformers(BERT) label semantic information Bidirectional Long Short-Term Memory(BiLSTM)neural network attention mechanism

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1杨菊英,刘燚,罗佳.基于划分子集主题模型的多标签极限分类[J].计算机工程与设计,2020,41(12):3432-3437. 被引量：2
2姚佳奇,徐正国,燕继坤,熊钢,李智翔.基于标签语义相似的动态多标签文本分类算法[J].计算机工程与应用,2020,56(19):94-98. 被引量：10
3檀何凤,刘政怡.基于标签相关性的K近邻多标签分类方法[J].计算机应用,2015,35(10):2761-2765. 被引量：10
4肖琳,陈博理,黄鑫,刘华锋,景丽萍,于剑.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089. 被引量：59
5王敏蕊,高曙,袁自勇,袁蕾.基于动态路由序列生成模型的多标签文本分类方法[J].计算机应用,2020,40(7):1884-1890. 被引量：7

二级参考文献21

1TSOUMAKAS G, KATAKIS I. Muhi-label classification: an over- view[ J]. Database Technologies Concepts Methodologies Tools and Applications, 2007,2007(3): 1 -13.
2BOUTELL M R, LOU J, SHEN X, et al. Learning multi-label scene classification[ J]. Pattern Recognition, 2004, 37(9) : 1757 - 1771.
3HUANG S-J, ZHOU Z-H. Multi-tabel teaming by exploiting label correlations locally[ C]// AAAI 2012: Proceedings of the 26th AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press, 2012:949 -955.
4ZHANG M, ZHANG K. Multi-label learning by exploiting label de- pendency[ C]//KDD 2010: Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2010:999 - 1008.
5ZHANG M, ZHOU Z. Multi-label neural networks with applications to functional genomics and text categorization [ J]. IEEE Transac- tions on Knowledge and Data Engineering, 2006, 18(10) : 1338 -1351.
6SCHAPIRE R E, SINGER Y. BoosTexter: a boosting-based system for text categorization[ J]. Machine Learning, 2000, 39(2/3) : 135 - 168.
7ZHANG M-L, ZHOU Z-H. ML-KNN: a lazy learning approach to multi-label learning[J]. Pattern Recognition, 2007, 40(7) :2038 - 2048.
8TSOUMAKAS G, VLAHAVAS I. Random k-Labelsets: an ensem- ble method for multi-label classification [ C]// ECML 2007: Pro- ceedings of the 18th European Conference on Machine Learning, LNCS 4701, Berlin: Springer-Verlag, 2007:406 -417.
9READ J, PFAHRINGER B, HOLMES G, et al. Classifier chains for multi-label classification[ C]//ECML PKDD 2009: Proceedings of the 2009 European Conference on Machine Learning and Knowl- edge Discovery in Databases, LNCS 5782. Berlin: Springer-Verlag, 2009:254-269.
10GAO W, ZHOU Z. On the consistency of multi-label learning[ J]. Artificial Intelligence, 2013, 199(3) : 22 -44.

共引文献77

1瞿合祚,李晓明,陈陈,何乐.基于卷积神经网络的电能质量扰动分类[J].武汉大学学报（工学版）,2018,51(6):534-539. 被引量：31
2宋才华,陈春梅,邓乾.供电企业存量客户用电地址数据结构化与规范化的清理方法研究[J].微型电脑应用,2018,34(10):78-80. 被引量：2
3韩栋,王春华,肖敏.结合旋转森林和Ada Boost分类器的多标签文本分类方法[J].计算机应用研究,2018,35(12):3655-3658. 被引量：10
4李兆玉,王纪超,雷曼,龚琴.基于引力模型的多标签分类算法[J].计算机应用,2018,38(10):2807-2811. 被引量：7
5陆凯,徐华.ML-kNN算法在大数据集上的高效应用[J].计算机工程与应用,2019,55(1):84-88. 被引量：5
6陆凯,徐华.基于最近邻距离权重的ML-KNN算法[J].计算机应用研究,2020,37(4):982-985. 被引量：4
7武越,刘向东,周晓俊,石兆军,李可.涉密环境下的非密办公网敏感信息监控系统设计[J].网络安全技术与应用,2020(7):28-31. 被引量：4
8楼姣,马伟锋,季曹婷,马来宾.基于语义共现与注意力网络的问题分类方法[J].浙江科技学院学报,2020,32(4):264-271. 被引量：1
9徐志栋,陈炳阳,王晓,张卫山.基于胶囊网络的方面级情感分类研究[J].智能科学与技术学报,2020,2(3):284-292. 被引量：4
10严春满,王铖.卷积神经网络模型发展及应用[J].计算机科学与探索,2021,15(1):27-46. 被引量：63

同被引文献114

1张力元,王军.古籍数据库分面分类体系设计研究[J].图书馆建设,2021(3):56-61. 被引量：16
2王嫄,徐涛,王世龙,周宇博,史艳翠.层级标签语义引导的极限多标签文本分类策略[J].中文信息学报,2021,35(10):110-118. 被引量：1
3吴士存.民国时期的南海诸岛问题[J].民国档案,1996(3):127-132. 被引量：35
4李金明.中国南海疆域研究的问题与前瞻[J].南洋问题研究,2001(3):86-95. 被引量：10
5侯汉清,薛春香.用于中文信息自动分类的《中图法》知识库的构建[J].中国图书馆学报,2005,31(5):82-86. 被引量：25
6杨帆,叶潇,曹存根,邵志清.基于场合和角色的情绪知识获取与分析[J].计算机工程,2006,32(15):197-199. 被引量：3
7赵筱媛,苏竣.基于政策工具的公共科技政策分析框架研究[J].科学学研究,2007,25(1):52-56. 被引量：359
8徐威,董渊,白若鹞,张素琴.针对中文文本自动分类算法的评估体系[J].计算机科学,2007,34(8):177-179. 被引量：7
9施国良.国内外分面分类法基本理论研究述评[J].图书馆学研究,2008(12):2-5. 被引量：9
10胡文博,都云程,吕学强,施水才.基于多层条件随机场的中文命名实体识别[J].计算机工程与应用,2009,45(1):163-165. 被引量：25

引证文献13

1姜鹏.基于BERT的《中图法》文本分类系统及其影响因素分析[J].图书馆研究与工作,2022(5):43-48. 被引量：3
2于敬,石京京,刘文海.基于文本语义匹配的物品相关推荐算法[J].电子技术与软件工程,2022(7):206-211. 被引量：1
3彭玉芳,石进,徐浩,杨海平.基于BERT和分面分类的多标签的南海证据性数据分类研究[J].图书馆杂志,2022,41(5):102-108. 被引量：5
4赵金榜,秦绍伟,武浩.聚类感知的文本多标签分类模型[J].云南大学学报（自然科学版）,2022,44(5):902-911. 被引量：2
5田雨薇,张智.基于标签推理和注意力融合的多标签文本分类方法[J].计算机应用研究,2022,39(11):3315-3319. 被引量：3
6马雨萌,黄金霞,王昉,芮啸.融合BERT与多尺度CNN的科技政策内容多标签分类研究[J].情报杂志,2022,41(11):157-163. 被引量：8
7张猛.基于医疗BERT的电子病历命名实体识别[J].信息技术与信息化,2023(2):122-125.
8张思阳,魏苏波,孙争艳,张顺香,朱广丽,吴厚月.基于多标签Seq2Seq模型的情绪-原因对提取模型[J].数据分析与知识发现,2023,7(2):86-96.
9张全,赵郭燚,苏媛,朱元极,任海洋.基于改进Bert-AutoML的电力文本语义识别算法[J].电子设计工程,2024,32(4):43-46. 被引量：1
10徐江玲,陈兴荣.基于层级图标签表示网络的多标签文本分类[J].计算机应用研究,2024,41(2):388-392. 被引量：1

二级引证文献24

1卢小宾,鲁国轩,杨冠灿,祁天娇.政府网站开放公文主题分类自动标注方法[J].档案学通讯,2022(5):19-27. 被引量：4
2于达海,常奥飞,化柏林,王宏光,郑文蛟.欧美科技政策文本扫描与监测系统实现[J].科技情报研究,2023,5(1):43-57. 被引量：1
3骆欣,纪颖.结合内容特征提取和弹幕文本的短视频推荐模型构建及仿真[J].自动化与仪器仪表,2023(1):42-47.
4赵志杰,张艳艳,毛翔宇.基于改进Adam优化算法的中文短文本分类方法[J].电子测量技术,2022,45(23):132-138. 被引量：4
5杨森淇,段旭良,肖展,郎松松,李志勇.基于ERNIE+DPCNN+BiGRU的农业新闻文本分类[J].计算机应用,2023,43(5):1461-1466. 被引量：5
6丁晓蔚,季婧,赵笑宇,王本强,丁毅杰,王献东.互联网金融安全情绪感知及风险预警应用研究——基于BERT所作的探索[J].情报杂志,2023,42(9):57-70. 被引量：3
7姚汝婧,王芳.基于多粒度标签扰动的文本分类研究[J].现代情报,2024,44(1):25-36. 被引量：1
8刘影,余进,陈莉.基于改进卷积神经网络的多标签文本自动化分类研究[J].自动化与仪器仪表,2023(11):62-66. 被引量：1
9胡志强,李朋骏,王金龙,熊晓芸.基于ChatGPT增强和监督对比学习的政策工具归类研究[J].计算机工程与应用,2024,60(7):292-305. 被引量：1
10刘陶,李锦,邱望仁.基于标题相似度聚类新中国陶瓷知识[J].景德镇陶瓷,2024,52(1):9-12.

1王浩镔,胡平.采用多级特征的多标签长文本分类算法[J].计算机工程与应用,2021,57(15):193-199. 被引量：11
2丰赢政,赵东标,申珂楠,赵世超.飞机起落架液压收放系统的故障程度诊断[J].机械制造与自动化,2022,51(1):217-220. 被引量：3
3王雪松,龚慧,王晓杰.光催化技术对黑臭水体去除速率模型构建及去除效果评价[J].水利技术监督,2022(2):108-112.
4王晓辉,邓威威,齐旺.基于PSO-LSTM的电力负荷预测模型[J].上海节能,2022(2):164-169. 被引量：19
5唐健,肖明轩,侯晔,沈超,徐华,冯春.核电站板式换热器污垢热阻长时预测方法[J].电子测量技术,2021,44(22):102-107. 被引量：2
6刘翔.监控视频中融合携带物判断的步态识别研究[J].广东公安科技,2021,29(3):52-54. 被引量：2
7沈银,席燕辉,陈子璇.基于多通道卷积双向长短时记忆网络的输电线故障分类[J].电力系统保护与控制,2022,50(3):114-120. 被引量：6
8叶宇剑,王卉宇,汤奕,Goran STRBAC.基于深度强化学习的居民实时自治最优能量管理策略[J].电力系统自动化,2022,46(1):110-119. 被引量：7
9金宇悦,康健,陈永杰.基于LSTM循环神经网络算法的风电预测技术[J].电子测试,2022,36(2):49-51. 被引量：4
10廉士勇,刘忠涛.人工智能技术在现代媒体资产管理系统中的应用[J].现代电视技术,2022(1):90-92. 被引量：5

计算机应用

2022年第1期

浏览历史

内容加载中请稍等...

融合BERT与标签语义注意力的文本多标签分类方法被引量：13

参考文献5

二级参考文献21

共引文献77

同被引文献114

引证文献13

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

融合BERT与标签语义注意力的文本多标签分类方法 被引量：13

参考文献5

二级参考文献21

共引文献77

同被引文献114

引证文献13

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

融合BERT与标签语义注意力的文本多标签分类方法被引量：13