Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类...Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。展开更多
RUC(Unsupervised Image Clustering with Robust Learning)是一种为改善聚类性能而提出的图像分类方法,但是由于它的协同训练仅适用于双视图数据集,并且没有考虑到数据之间相似性对其伪标签采样策略的影响,此外其使用的Mixmatch只是单...RUC(Unsupervised Image Clustering with Robust Learning)是一种为改善聚类性能而提出的图像分类方法,但是由于它的协同训练仅适用于双视图数据集,并且没有考虑到数据之间相似性对其伪标签采样策略的影响,此外其使用的Mixmatch只是单纯地进行k次随机增强求均值却没有考虑到强增强与弱增强的联系。为了解决这些问题,该文提出了HFC(classification method based on Hybrid sampling strategy and Fixmatch)。首先,设计了一种置信度与距离的伪标签采样策略,联合两种策略以提高筛选到正确标签的概率;其次,使用Tri-training取代Co-training,即通过两个分类器指导第三个分类器进行训练,使得模型不再受限于双视图数据集;最后,采用目前较好的Fixmatch的数据增强方法取代RUC中Mixmatch随机增强,以突出强增强与弱增强的联合作用。HFC在CIFAR-10、CIFAR-100和STL-10数据集上进行实验,取得了较好的结果,验证了该方法的有效性。展开更多
文摘Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。
文摘RUC(Unsupervised Image Clustering with Robust Learning)是一种为改善聚类性能而提出的图像分类方法,但是由于它的协同训练仅适用于双视图数据集,并且没有考虑到数据之间相似性对其伪标签采样策略的影响,此外其使用的Mixmatch只是单纯地进行k次随机增强求均值却没有考虑到强增强与弱增强的联系。为了解决这些问题,该文提出了HFC(classification method based on Hybrid sampling strategy and Fixmatch)。首先,设计了一种置信度与距离的伪标签采样策略,联合两种策略以提高筛选到正确标签的概率;其次,使用Tri-training取代Co-training,即通过两个分类器指导第三个分类器进行训练,使得模型不再受限于双视图数据集;最后,采用目前较好的Fixmatch的数据增强方法取代RUC中Mixmatch随机增强,以突出强增强与弱增强的联合作用。HFC在CIFAR-10、CIFAR-100和STL-10数据集上进行实验,取得了较好的结果,验证了该方法的有效性。