基于变分信息瓶颈多任务算法的多领域文本分类

Variational information bottleneck and multi-task learning for multi-domain text classification

下载PDF

导出

摘要多领域文本分类存在领域差异和词汇差异,导致分类的准确性和泛化性低,传统方法无法取得很好的效果.针对上述问题,本文提出基于变分信息瓶颈多任务算法的多领域文本分类方法,将任务建模为从综合特征中提取任务专属特征的分层学习表示问题.首先基于信息瓶颈原理,将综合特征和任务专属特征之间存在的冗余信息建模为均值为零,方差为对角矩阵的加性噪声,通过重参数化方法让噪声参与模型训练;其次通过信息瓶颈的变分边界构建模型损失函数以限制模型的信息流动,从而将带有加性噪声的综合特征解耦为任务专属特征;最后通过解码器中的分类器处理任务专属特征得到文本分类结果.实验表明,该模型在FDU-MTL多领域文本分类数据集上的平均分类准确率达到92.17%,较多个对比模型有明显提升,且该模型具有更好的可解释性. Multi-domain text classification is challenged by domain and vocabulary differences,resulting in low accuracy and generalization.Traditional methods are ineffective in addressing this issue.This paper proposes a multi-domain text classification method based on a variational information bottleneck multi-task algorithm.The task is formulated as a hierarchical learning representation problem that extracts task-specific features from comprehensive features.Firstly,we introduce additive between comprehensive features and taskspecific features,following the information bottleneck principle.Secondly,we construct a model loss function to limit the information flow through the variational boundary of the information bottleneck,decoupling the comprehensive features with additive noise into task-specific features.Finally,the classifier in the decoder utilizes the task-specific features to generate text classification results.The proposed model achieves an average classification accuracy of 92.17%on the FDU-MTL multi-domain text classification dataset,outperforming several compared models and demostrating better interpretability.

作者马儀邵玉斌杜庆治龙华马迪南 MA Yi;SHAO Yu-Bin;DU Qing-Zhi;LONG Hua;MA Di-Nan(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China;Yunnan Provincial Key Laboratory of Media Integration,Kunming 650032,China)

机构地区昆明理工大学信息工程与自动化学院云南省媒体融合重点实验室

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2024年第3期125-135,共11页 Journal of Sichuan University(Natural Science Edition)

基金云南省媒体融合重点实验室项目资助(320225403)。

关键词信息瓶颈多任务模型多领域变分边界可解释性 Information bottleneck Multi-task model Multi-domain Variational boundary Interpretability

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1马式琨,滕冲,李霏,姬东鸿.基于领域特征提纯的多领域文本分类[J].中文信息学报,2022,36(8):92-100. 被引量：1
2刘云,张轶,郑文凤.降噪分层映射算法在多维聚类分析中的优化研究[J].四川大学学报（自然科学版）,2022,59(1):78-86. 被引量：4
3汪嘉伟,杨煦晨,琚生根,袁宵,谢正文.基于卷积神经网络和自注意力机制的文本分类模型[J].四川大学学报（自然科学版）,2020,57(3):469-475. 被引量：25
4刘博,蒲亦非.基于BERT的长文本分类方法[J].四川大学学报（自然科学版）,2023,60(2):75-82. 被引量：7

二级参考文献11

1冯超,黎海辉,赵洪雅,薛云,唐婧尧.基于层次注意力机制和门机制的属性级别情感分析[J].中文信息学报,2021,35(10):128-136. 被引量：6
2高云龙,左万利,王英,王鑫.基于集成神经网络的短文本分类模型[J].吉林大学学报（理学版）,2018,56(4):933-938. 被引量：12
3陈波.基于循环结构的卷积神经网络文本分类方法[J].重庆邮电大学学报（自然科学版）,2018,30(5):705-710. 被引量：14
4杨志明,王来奇,王泳.基于双通道卷积神经网络的问句意图分类研究[J].中文信息学报,2019,33(5):122-131. 被引量：11
5刘凯,方勇,张磊,左政,刘亮.基于图卷积网络的恶意代码聚类[J].四川大学学报（自然科学版）,2019,56(4):654-660. 被引量：9
6凌语,孙自强.基于卷积神经网络的乳腺病理图像识别算法[J].江苏大学学报（自然科学版）,2019,40(5):573-578. 被引量：20
7高云龙,吴川,朱明.基于改进卷积神经网络的短文本分类模型[J].吉林大学学报（理学版）,2020,58(4):923-930. 被引量：19
8邓描,刘强,陈洪刚,王正勇,何小海.一种基于特征正则约束的异常检测方法[J].四川大学学报（自然科学版）,2020,57(6):1077-1083. 被引量：4
9胡玉兰,赵青杉,陈莉,牛永洁.面向中文新闻文本分类的融合网络模型[J].中文信息学报,2021,35(3):107-114. 被引量：10
10朱海景,余谅,盛钟松,陈贵强,王争.基于静态路由分组胶囊网络的文本分类模型[J].四川大学学报（自然科学版）,2021,58(6):33-39. 被引量：2

共引文献33

1彭学勤,董梦雪,马琳.大数据背景下塑料光纤通信系统安全态势诊断研究[J].塑料科技,2020,48(8):73-76. 被引量：11
2王国桥,牛少彰.基于TF-IDF的社交电商文本信息分类研究[J].网络空间安全,2020,11(12):32-38. 被引量：6
3刘仲博.基于卷积神经网络的电选粉煤灰颗粒图像识别与烧失量预测模型[J].中国矿业,2021,30(5):125-129. 被引量：2
4刘婷,张社荣,李志竑,关炜.基于字符级CNN的调水工程巡检文本智能分类方法[J].水力发电学报,2021,40(6):89-98. 被引量：14
5李攀锋,林锋,蒋宗神.基于多模板模糊竞争的涉案财物关系抽取方法[J].四川大学学报（自然科学版）,2021,58(4):50-56.
6张彦晖,吕娜,刘鹏飞,陈卓.基于卷积注意力门控循环网络的加密流量分类方法[J].信号处理,2021,37(7):1180-1188. 被引量：7
7陈永刚,陈丽珊,邹易,孙余顺.基于深度学习的包装组件检测系统研究[J].包装工程,2021,42(15):284-291. 被引量：2
8赵革委,胡海东.基于局部卷积神经网络算法的文本分类识别[J].微型电脑应用,2021,37(8):136-139. 被引量：1
9魏胜楠,张景异,陈亮,耿俊香,王中洲.自适应局部关系网络的小样本学习方法[J].沈阳理工大学学报,2021,40(4):35-41. 被引量：4
10周末,宋玉蓉,宋波,苏晓萍.融合自注意力机制的D-BGRU文本分类模型[J].微电子学与计算机,2021,38(12):8-16. 被引量：5

1张敬,李彤,杨钧,朱得糠,张士峰.一种基于几何关系的无人机航迹规划方法[J].兵器装备工程学报,2024,45(1):288-295.
2王若男,董琦.基于学习机制的多智能体强化学习综述[J].工程科学学报,2024,46(7):1251-1268.
3朱晋恺,方兰婷,季小文,黄杰.基于行为特征和语义特征的多模态Android恶意软件检测方法[J].电子科技,2024,37(5):71-78.
4郭宇欣.英汉翻译中的语言特征差异及翻译策略研究[J].海外英语,2024(1):35-38. 被引量：1
5尹华,卢懿亮,季跃蕾,吴梓浩,彭亚男.抽象语义表示解析方法研究综述[J].中文信息学报,2024,38(3):1-23.
6刘骥.大数据背景下本科院校高等数学课程改革研究[J].学周刊,2024(19):13-16.
7肖九根,张家焘,廖丽红.从词汇特点看宁都客家话的内部差异[J].赣南师范大学学报,2024,45(2):88-94.
8付芸,朱丽雅,李丹,孙蒙鸽,张建锋,刘细文.ULEO:表示合成实验规程的实验操作统一语言[J].数据分析与知识发现,2024,8(1):30-39.
9张聪.清末民初白话小说与现代汉语中“动动式复合名词”的差异[J].辽东学院学报（社会科学版）,2023,25(6):64-69.
10罗经昊.普通话称谓词与港粤称谓词的差异成因初探[J].国学（汉斯）,2024,12(1):117-122.

四川大学学报（自然科学版）

2024年第3期

浏览历史

内容加载中请稍等...

基于变分信息瓶颈多任务算法的多领域文本分类

参考文献4

二级参考文献11

共引文献33

相关作者

相关机构

相关主题

浏览历史