基于混合式迁移学习的文本分类方法

Text Classification Method Based on Mixed Transfer Learning

下载PDF

导出

摘要单一的迁移学习存在无法有效的将知识迁移到目标领域的问题,且迁移过程中易出现负迁移现象,在此背景下,提出了基于混合式迁移学习的文本分类方法。该方法首先利用样本之间的距离作为权衡样本相似性的标准进行样本迁移以扩充目标领域样本,然后利用模型迁移建立带有数据分布自适应的文本分类深度网络结构,最后用扩充后的目标领域数据集来训练网络。实验中使用不同的预训练模型来验证方法的有效性,其中,MT2CERNIE的准确率达到0.884、召回率达到0.890、F1分数达到0.878,具有最佳的预测性能。结果表明,所提方法能够在一定程度上解决标注样本不足、出现负迁移现象等问题。 Single transfer learning can not effectively transfer knowledge to the target domain, and the phenomenon of negative transfer is easy to occur in the transfer process. In this context, a text classification method based on mixed transfer learning is proposed. In this method, the distance between samples is used as the standard to weigh the similarity of samples to expand the target domain samples. Then, the model migration is used to build the deep network structure of text classification with adaptive data distribution, and the network is trained with the expanded target domain dataset. In the experiment, different pre-training models were used to verify the effectiveness of the method. Among them, MT2CERNIE had the best prediction performance with the accuracy of 0.884, recall rate of 0.890 and F1 score of 0.878.The results show that the proposed method can solve the problems of insufficient labeled samples and negative migration to a certain extent.

作者张合欢陈致君杨顶 ZHANG Hehuan;CHEN Zhijun;YANG Ding(College of Computer and Information,China Three Gorges University,Yichang 443002,China)

机构地区三峡大学计算机与信息学院

出处《长江信息通信》 2022年第5期54-57,共4页 Changjiang Information & Communications

关键词迁移学习预训练模型领域数据分布文本分类 transferlearning pre-trainingmodel domain datadistribution textclassification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1张驰名,王庆凤,刘志勤,黄俊,周莹,刘启榆,徐卫云.基于深度迁移学习的肺结节辅助诊断方法[J].计算机工程,2020,46(1):271-278. 被引量：27

二级参考文献1

1杨涵方,周向东.基于深度稀疏辨别的跨领域图像分类[J].计算机工程,2018,44(4):310-316. 被引量：5

共引文献26

1张若愚,吴俊勇,李宝琴,邵美阳.基于迁移学习的电力系统暂态稳定自适应预测[J].电网技术,2020,44(6):2196-2203. 被引量：41
2梁淑芬,陈琛,秦传波,冯跃,杨芳臣,付迎迎.基于CNN-L1/L2-ELM混合架构的肺结节分类研究[J].五邑大学学报（自然科学版）,2020,34(2):46-53.
3冯毅博,仇大伟,曹慧,张俊忠,辛在海,刘静.基于深度可分离稠密网络的新型冠状病毒肺炎X线图像检测方法研究[J].生物医学工程学杂志,2020,37(4):557-565. 被引量：14
4蒋佳旺,陈艳,王佳庆.卷积神经网络与迁移学习的颅脑癌症识别方法的研究[J].中国医疗设备,2020,35(9):70-73. 被引量：3
5朱冬亮,文奕,陶欣.深度学习在生物医学领域的应用进展述评[J].世界科技研究与发展,2020,42(5):510-519. 被引量：2
6陈道争,江倩.基于卷积神经网络和迁移学习的肺结节检测[J].计算机工程与设计,2021,42(1):240-247. 被引量：11
7党维涛,马进,张利利,张太辉,程珊,惠铎铎,胡文东.基于迁移学习的上肢骨骼X射线片异常分类与定位[J].医疗卫生装备,2021,42(2):1-5. 被引量：5
8孔月萍,党爽,曾军,高凯.融合卷积神经网络与多层感知器的鞍部识别方法[J].小型微型计算机系统,2021,42(2):409-413.
9邹雨楠,徐秀芳,陈艾清,魏琪,范一峰.基于CT图像的肺结节计算机辅助检测研究进展[J].计算机时代,2021(3):10-13. 被引量：2
10冯翔,康文清,吴瀚,王风云,王星皓,季超.基于深度特征融合的肺炎影像识别研究[J].生物医学工程研究,2021,40(1):28-32. 被引量：2

1杨一.中小企业应用系统云化迁移的探究[J].电子元器件与信息技术,2022,6(5):100-103. 被引量：1
2李天雁.频率迁移过程中数字电视发射机运作的技术解析[J].西部广播电视,2022,43(10):235-237. 被引量：2
3陈颖,于炯,陈嘉颖,杜旭升.基于交叉层级数据共享的多任务模型[J].计算机应用,2022,42(5):1447-1454. 被引量：1
4郭志伟,陈新庄.基于Cheng-范数的不同维度样本相似性度量[J].延安大学学报（自然科学版）,2022,41(2):29-35.
5翟乃举,周晓锋,李帅,史海波.基于迁移学习和知识蒸馏的加热炉温度预测[J].计算机集成制造系统,2022,28(6):1860-1869. 被引量：6
6汪航,田晟兆,唐青,陈端兵.基于多尺度标签传播的小样本图像分类[J].计算机研究与发展,2022,59(7):1486-1495. 被引量：5
7郭忠升.水土保持新理论[J].水土保持,2022,10(2):13-20.
8童晰颖,孙婷婷.湖北方言中的音系现象对二语语音习得产生的负迁移影响及启示[J].今古文创,2022(26):102-104.
9赵剑锟,姜爽,李泳珲,刘玉娟,曾奇,吴和喜,刘义保,严紫薇.基于Unity3D的核事故后放射性物质大气、水体扩散虚拟仿真实验[J].实验技术与管理,2022,39(6):137-143. 被引量：2
10李娟,王亚静,陈月波,顾典润,林茹,杨相东.聚合物包膜控释肥料膜壳累积、降解及对土壤质量影响的研究进展[J].植物营养与肥料学报,2022,28(6):1113-1121. 被引量：4

长江信息通信

2022年第5期

浏览历史

内容加载中请稍等...

基于混合式迁移学习的文本分类方法

参考文献1

二级参考文献1

共引文献26

相关作者

相关机构

相关主题

浏览历史