-
题名动态微调的模型集成算法Bagging-DyFAS
- 1
-
-
作者
李龚林
范一晨
米宇舰
李明
-
机构
西安理工大学经济与管理学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第S02期28-33,共6页
-
基金
陕西省大学生创新创业训练计划项目(S202210700148)。
-
文摘
针对单一模型用于文本分类存在的模型体量大,难以适用于舆情信息文本的多元化非规范的表达等问题,提出基于Bagging训练思想的、动态微调和二次加权的模型集成算法(Bagging-DyFAS)。首先,使用自助采样构建的数据集训练弱分类器,使该分类器具有一定的先验知识;其次,依据该分类器在开发集的表现,进行一次动态加权和一次静态加权,并使用得到的一系列权重将模型泛化到无标注的数据上,进一步提升模型在文本分类任务的性能。在所构建的数据集上的实验结果表明,在训练一轮的情况下,相较于基线模型MiniBRT、BRT3和LERT(Linguisticallymotivated bidirectional Encoder Representation from Transformer),所提算法的准确率、精确率、召回率和F1值分别至少提升3.6、3.8、1.3和3.2个百分点,实验结果验证了所提算法的有效性。
-
关键词
文本分类
模型集成
二次加权
动态加权
舆情分析
预训练语言模型
-
Keywords
text classification
model ensemble
quadratic weighting
dynamic weighting
public opinion analysis
pre-training language model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-