大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)...大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性.展开更多
半监督分类研究的主要内容是,如何有效地利用大量的无类别标签的数据对分类问题所具有的有用信息。该文提出了一种基于流形判别分析的半监督支持向量机(Semi-Supervised Support Vector Machine Based on Manifold-based Discriminant A...半监督分类研究的主要内容是,如何有效地利用大量的无类别标签的数据对分类问题所具有的有用信息。该文提出了一种基于流形判别分析的半监督支持向量机(Semi-Supervised Support Vector Machine Based on Manifold-based Discriminant Analysis,简称MDASSVM)。通过定义基于流形的类内离散度和类间离散度,充分利用流形判别分析的性质,进一步改进半监督支持向量机,在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构,该方法不仅继承了传统降维方法的优势,而且进一步提高降维效率。人造数据集和UCI中的部分实际数据集上的实验结果表明,与现有算法相比,数据集通过该算法降维后,能使半监督支持向量机有更高的分类精度。展开更多
文摘大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性.
文摘半监督分类研究的主要内容是,如何有效地利用大量的无类别标签的数据对分类问题所具有的有用信息。该文提出了一种基于流形判别分析的半监督支持向量机(Semi-Supervised Support Vector Machine Based on Manifold-based Discriminant Analysis,简称MDASSVM)。通过定义基于流形的类内离散度和类间离散度,充分利用流形判别分析的性质,进一步改进半监督支持向量机,在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构,该方法不仅继承了传统降维方法的优势,而且进一步提高降维效率。人造数据集和UCI中的部分实际数据集上的实验结果表明,与现有算法相比,数据集通过该算法降维后,能使半监督支持向量机有更高的分类精度。