线性局部切空间排列算法(Linear local tangent space alignment,LLTSA)是能够较好应用于模式识别问题的降维方法,但由于其属于无监督的降维方法且在降维过程中只使用全局统一的邻域参数,使得在对高维数据集进行约简时,不能利用部分样...线性局部切空间排列算法(Linear local tangent space alignment,LLTSA)是能够较好应用于模式识别问题的降维方法,但由于其属于无监督的降维方法且在降维过程中只使用全局统一的邻域参数,使得在对高维数据集进行约简时,不能利用部分样本的类别标签信息且不能根据样本空间分布的变化调整邻域参数。针对上述问题,提出了一种半监督邻域自适应线性局部切空间排列算法(Semi-supervised neighborhood self-adaptive LLTSA,SSNA-LLTSA)。该算法在LLTSA的基础上,利用部分标签信息来调整样本点与点之间的距离以形成新的距离矩阵来完成邻域构建,同时根据每个数据样本点邻域的概率密度自适应地调整邻域参数,进而得到更好的降维效果。经典的三维流形、UCI典型数据集模式识别和轴承故障诊断的实验结果表明,该算法克服了LLTSA算法无监督和使用全局统一邻域参数的不足,可更有效地寻找数据的低维本质流形,提高了识别准确率,具有一定优势。展开更多
流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针...流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针对不同类型数据集指定一个统一参数存在巨大挑战。基于此,提出一种基于自适应密度邻域关系的多标签在线流特征选择方法(multi-label online stream feature selection based on adaptive density neighborhood relation,ML-OFS-ADNR),基于邻域粗糙集理论,所提方法在特征依赖计算时无需任何先验领域信息。此外,提出了一种新的自适应密度邻域关系,使用周围实例的密度信息,可以在流特征选择过程中自动选择适当数量的邻域,不需要事先指定任何参数。通过模糊等价约束,ML-OFS-ADNR可以选择高依赖低冗余度的特征。实验表明在10种不同类型的数据集上,所提方法在特征数量相同的情况下优于传统特征选择方法和先进的在线流特征选择方法。展开更多
文摘线性局部切空间排列算法(Linear local tangent space alignment,LLTSA)是能够较好应用于模式识别问题的降维方法,但由于其属于无监督的降维方法且在降维过程中只使用全局统一的邻域参数,使得在对高维数据集进行约简时,不能利用部分样本的类别标签信息且不能根据样本空间分布的变化调整邻域参数。针对上述问题,提出了一种半监督邻域自适应线性局部切空间排列算法(Semi-supervised neighborhood self-adaptive LLTSA,SSNA-LLTSA)。该算法在LLTSA的基础上,利用部分标签信息来调整样本点与点之间的距离以形成新的距离矩阵来完成邻域构建,同时根据每个数据样本点邻域的概率密度自适应地调整邻域参数,进而得到更好的降维效果。经典的三维流形、UCI典型数据集模式识别和轴承故障诊断的实验结果表明,该算法克服了LLTSA算法无监督和使用全局统一邻域参数的不足,可更有效地寻找数据的低维本质流形,提高了识别准确率,具有一定优势。
文摘流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针对不同类型数据集指定一个统一参数存在巨大挑战。基于此,提出一种基于自适应密度邻域关系的多标签在线流特征选择方法(multi-label online stream feature selection based on adaptive density neighborhood relation,ML-OFS-ADNR),基于邻域粗糙集理论,所提方法在特征依赖计算时无需任何先验领域信息。此外,提出了一种新的自适应密度邻域关系,使用周围实例的密度信息,可以在流特征选择过程中自动选择适当数量的邻域,不需要事先指定任何参数。通过模糊等价约束,ML-OFS-ADNR可以选择高依赖低冗余度的特征。实验表明在10种不同类型的数据集上,所提方法在特征数量相同的情况下优于传统特征选择方法和先进的在线流特征选择方法。