基于密度峰值聚类和相对距离的半监督自训练方法

Semi-supervised Self-training Method Based on Density Peaks Clustering and Relative Distance

下载PDF

导出

摘要半监督自训练方法属于半监督自标记方法的一种,它能同时利用有标记样本和无标记样本来训练分类器。然而,对半监督自训练方法而言,误标记是一个不容忽视的问题。为此,文章提出了一种基于密度峰值聚类和相对距离的半监督自训练方法(STDPRD)。在迭代的自训练过程中,STDPRD首先用密度峰值聚类来选取具有高置信度的无标记样本,再标记他们;其次,STDPRD用相对距离来过滤掉在迭代过程中被误标记的样本;然后,STDPRD把在迭代过程中被正确标记的样本加入有标记集中;最后,STDPRD用被扩充的有标记集来训练给定的分类器,训练完成后,输出被训练的分类器。仿真实验结果表明,在真实数据集上,STDPRD的表现优于4种流行的半监督自训练方法。 The semi-supervised self-training method is a kind of semi-supervised self-labeling method,which can train the classifier with labeled samples and unlabeled samples at the same time.However,for semi-supervised self-training methods,mislabeling is a problem that cannot be ignored.To this end,this paper proposes a semi-supervised self-training method based on density peak clustering and relative distance(STDPRD).In the iterative self-training process,STDPRD first uses density peak clustering to select unlabeled samples with high confidence,and then labels them.Second,STDPRD uses relative distance to filter out samples that are mislabeled during iteration.STDPRD then adds the samples correctly labeled during the iteration to the labeled set.Finally,STDPRD trains a given classifier with an extended labeled set,and outputs the trained classifier after the training is completed.Simulation results show that STDPRD performs better than 4 popular semi-supervised self-training methods on real data sets.

作者孙洁景志敏周欢 Sun Jie;Jing Zhimin;Zhou Huan(School of Intelligent Equipment,Chongqing Vocational College of Public Transportation,Chongqing 402247,China;School of Automotive Engineering,Chongqing Energy College,Chongqing 402260,China)

机构地区重庆公共运输职业学院智能装备学院重庆能源职业学院汽车工程学院

出处《统计与决策》北大核心 2024年第17期53-58,共6页 Statistics & Decision

关键词半监督学习半监督分类相对距离误标记 semi-supervised learning semi-supervised classification relative distance mislabeling

分类号 O244 [理学—计算数学] TP391 [自动化与计算机技术—计算机应用技术] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1邱儒琼,何丽华,李孟璠.基于深度异构迁移学习的水稻遥感影像提取[J].湖北农业科学,2024,63(8):236-242.
2柳新强,徐欢,王栋.基于原型优化方法的分类器设计[J].微型电脑应用,2024,40(8):1-3.
3陈晓红,陈姣龙,胡东滨,梁伟,张威威.基于深度自编码器的自适应异常检测算法及其应用研究[J].系统工程理论与实践,2024,44(8):2718-2732.
4李佳斌,刘明杨,杨楠,范增辉,庞菲菲.基于密度泛函理论的B、P掺杂MoS_(2)/Gr异质结光电性能增强的调制机理[J].激光与光电子学进展,2024,61(13):324-334.
5郭名静,熊鑫.餐饮和零售行业热点区块提取与空间分布特征聚类分析[J].测绘科学,2024,49(6):203-210.
6温馨,李禄,范军芳,胡智峰,周锋,吴亚平.基于多尺度图卷积的高光谱图像分类[J].激光与红外,2024,54(8):1300-1308.
7袁志红,陈俊佳,李鹏,马江将,李克训.磁性原子吸附单壁碳纳米管的第一性原理研究[J].化学研究与应用,2024,36(9):2127-2136.
8KWAME B B,王毅,田双双,张晓星,黄佳辰,邹怡.环保绝缘介质C_(6)F_(12)O混合气体FTIR检测技术研究[J].高压电器,2024,60(9):126-134.
9肖焓艳,李洪涛,丁然,赵科,高山,卞超,田双双,刘伟豪,罗韦丰.分子筛物理结构和化学改性对C_(4)F_(7)N及其分解产物吸附特性的影响[J].绝缘材料,2024,57(9):26-36.
10郑国峰,万银青,隗寒冰,赵树恩.非道路特种车辆耐久性载荷谱的高置信度最少采集样本量[J].兵工学报,2024,45(9):3017-3028.

统计与决策

2024年第17期

浏览历史

内容加载中请稍等...

基于密度峰值聚类和相对距离的半监督自训练方法

相关作者

相关机构

相关主题

浏览历史