融合双通道标签语义的多标签文本分类模型

Multi-label text classification model integrating two-channel label semantics

下载PDF

导出

摘要针对多标签文本分类任务中的标签语义表示,提出了一种双通道标签语义增强模型。该模型包含2个重要的组成模块:基于标签共现的图卷积网络模块和基于预训练的标签语义嵌入模块。前者利用图卷积网络捕获标签之间的语义关联,增强每个标签的语义信息;后者利用预训练模型中的先验知识,增强标签的语义表示。最后,利用注意力机制融合并深度编码来自双通道的标签语义信息。在2个公开数据集AAPD、RCV1-V2上的多标签文本分类实验结果表明:与主流基线方法相比,该方法的精确率、召回率和微F1(Micro-F1)均有显著提升。 A two-channel label semantic enhancement model was proposed for label semantic representation in multi-label text classification tasks.The model comprised two key components:the graph convolutional network module based on label co-occurrence and the label semantic embedding module based on pre-training.The former leveraged graph convolutional network to capture semantic associations among labels,thereby enhancing the semantic information of each label.The latter utilized prior knowledge from pre-trained models to augment the semantic representation of labels.Finally,an attention mechanism was employed to fuse and deeply encode label semantic information from the dual channels.The experimental results of multi-label text classification on two public datasets,AAPD and RCV1-V2,indicate that compared with mainstream baseline methods,our framework demonstrates significant improvements in terms of precision,recall,and micro-F1.

作者冯心昊吕学强马登豪滕尚志田晶晶 FENG Xinhao;L Xueqiang;MA Denghao;TENG Shangzhi;TIAN Jingjing(Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science&Technology University,Beijing 102206,China;China National Institute of Standardization,Beijing 100012,China)

机构地区北京信息科技大学网络文化与数字传播北京市重点实验室中国标准化研究院

出处《北京信息科技大学学报（自然科学版）》 2024年第4期49-54,共6页 Journal of Beijing Information Science and Technology University

基金国家自然科学基金项目(62171043) 国家语委项目(ZDI145-10) 中国标准化研究院院长基金项目(282022Y-9461)。

关键词多标签文本分类标签语义嵌入预训练语言模型图卷积网络 multi-label text classification label semantic embedding pre-trained language model graph convolutional network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1宋泽宇,李旸,李德玉,王素格.融合标签关系的法律文本多标签分类方法[J].模式识别与人工智能,2022,35(2):185-192. 被引量：4
2吕学强,彭郴,张乐,董志安,游新冬.融合BERT与标签语义注意力的文本多标签分类方法[J].计算机应用,2022,42(1):57-63. 被引量：13
3李鹏芳,刘芳,李玲玲,刘旭,冯志玺,焦李成,熊怡梦.嵌入标签语义的元特征再学习和重加权小样本目标检测[J].计算机学报,2022,45(12):2561-2575. 被引量：6
4陈玮,林雪健,尹钟.基于神经网络融合标签相关性的多标签情感预测研究[J].中文信息学报,2021,35(1):104-112. 被引量：6
5梁睿博,王思远,李壮,刘亚松.基于RAKEL算法的商品评论多标签分类研究与实现[J].软件工程,2019,22(1):8-11. 被引量：3

二级参考文献15

1吕小勇,石洪波.基于频繁项集的多标签文本分类算法[J].计算机工程,2010,36(15):83-85. 被引量：4
2史绍亮,文益民,缪裕青.中文微博情感分类的简单多标签排序算法[J].计算机应用,2015,35(10):2721-2726. 被引量：3
3檀何凤,刘政怡.基于标签相关性的K近邻多标签分类方法[J].计算机应用,2015,35(10):2761-2765. 被引量：10
4张洛阳,毛嘉莉,刘斌,吴涛.基于贝叶斯模型的多标签分类算法[J].计算机应用,2016,36(1):52-56. 被引量：4
5周恩波,叶荣华,张微微,周子涵.一种基于成对标签的Rakel算法改进[J].计算机与现代化,2016(3):16-18. 被引量：3
6金永贤,张微微,周恩波.一种改进的RAKEL多标签分类算法[J].浙江师范大学学报（自然科学版）,2016,39(4):386-391. 被引量：2
7肖琳,陈博理,黄鑫,刘华锋,景丽萍,于剑.基于标签语义注意力的多标签文本分类[J].软件学报,2020,31(4):1079-1089. 被引量：59
8王敏蕊,高曙,袁自勇,袁蕾.基于动态路由序列生成模型的多标签文本分类方法[J].计算机应用,2020,40(7):1884-1890. 被引量：7
9谌志群,鞠婷.基于BERT和双向LSTM的微博评论倾向性分析研究[J].情报理论与实践,2020,43(8):173-177. 被引量：44
10姚佳奇,徐正国,燕继坤,熊钢,李智翔.基于标签语义相似的动态多标签文本分类算法[J].计算机工程与应用,2020,56(19):94-98. 被引量：10

共引文献25

1谈俊林.大数据技术在通信运营商异网获客系统的应用[J].软件工程,2020,23(1):27-29. 被引量：1
2蒲松,黄河,张翔,黄浩鹏,于连栋.基于直线方程的测量机软件标签自动排布方法[J].工具技术,2021,55(11):112-115.
3王浩.基于深度学习的情感分析系统设计[J].信息与电脑,2021,33(19):80-82.
4姜鹏.基于BERT的《中图法》文本分类系统及其影响因素分析[J].图书馆研究与工作,2022(5):43-48. 被引量：3
5于敬,石京京,刘文海.基于文本语义匹配的物品相关推荐算法[J].电子技术与软件工程,2022(7):206-211. 被引量：1
6彭玉芳,石进,徐浩,杨海平.基于BERT和分面分类的多标签的南海证据性数据分类研究[J].图书馆杂志,2022,41(5):102-108. 被引量：5
7赵静,韩京宇,钱龙,毛毅.基于改进的RAKEL算法的心电图诊断分类[J].计算机应用,2022,42(6):1892-1897.
8赵金榜,秦绍伟,武浩.聚类感知的文本多标签分类模型[J].云南大学学报（自然科学版）,2022,44(5):902-911. 被引量：2
9田雨薇,张智.基于标签推理和注意力融合的多标签文本分类方法[J].计算机应用研究,2022,39(11):3315-3319. 被引量：3
10马雨萌,黄金霞,王昉,芮啸.融合BERT与多尺度CNN的科技政策内容多标签分类研究[J].情报杂志,2022,41(11):157-163. 被引量：8

1管霖,陈鎏凯,陈灏颖,李永哲.考虑新能源随机性的新型电力系统图深度学习稳定指标概率分布评估模型[J].南方电网技术,2024,18(7):118-128.
2Sergey Pershin,Irina Bjørnø,Michael Grishin.Water Photomolecular Evaporation Due to Light-Mediated Ortho-Para Spin Transitions[J].Open Journal of Applied Sciences,2024,14(8):2201-2206.

北京信息科技大学学报（自然科学版）

2024年第4期

浏览历史

内容加载中请稍等...

融合双通道标签语义的多标签文本分类模型

参考文献5

二级参考文献15

共引文献25

相关作者

相关机构

相关主题

浏览历史