为解决传统机器学习中训练集(源域)与测试集(目标域)数据分布不一致导致分类准确率较低的问题,提出一种基于半监督判别分析和CDMD的领域自适应算法(SDA-CDMD)。首先,使用半监督判别分析(SDA)进行数据降维,保留了映射到低维子空间中数据...为解决传统机器学习中训练集(源域)与测试集(目标域)数据分布不一致导致分类准确率较低的问题,提出一种基于半监督判别分析和CDMD的领域自适应算法(SDA-CDMD)。首先,使用半监督判别分析(SDA)进行数据降维,保留了映射到低维子空间中数据的几何结构信息。其次,提出一种衡量两个域之间分布差异的度量准则:跨域均值差异(Cross-Domain Mean Discrepancy,CDMD)。最后,将SDA与CDMD结合,将两个域投影到同一子空间中,减少两个域之间的分布差异。在手写数字图像和计算机视觉数据集上进行的大量实验结果表明,所提算法优于传统的领域自适应方法,验证了其有效性。展开更多
大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)...大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性.展开更多
针对有标记故障样本不足和故障特征集维数过高的问题,提出基于正交半监督局部Fisher判别分析(Orthogonal semi-supervised local Fisher discriminant analysis,OSELF)的故障诊断方法。所提出的OSELF能够充分地利用蕴含于无标记故障样...针对有标记故障样本不足和故障特征集维数过高的问题,提出基于正交半监督局部Fisher判别分析(Orthogonal semi-supervised local Fisher discriminant analysis,OSELF)的故障诊断方法。所提出的OSELF能够充分地利用蕴含于无标记故障样本中的故障信息,避免了因有标记故障样本不足引起的过学习问题,同时采用正交迭代方式求解最优正交映射矩阵,克服现有方法无法得到正交映射矩阵的不足。正交映射矩阵的基矢量统计不相关,可有效地提高所得低维特征矢量的可辨识性。通过正交映射矩阵对故障样本集和新增样本进行维数约简,并将维数约简的结果输入粗糙优化k最近邻分类器(Coarse to fine k nearest neighbor classifier,CFKNNC)进行学习训练和故障识别。所提方法集成了OSELF在维数约简和CFKNNC在模式识别的优势,有效地提高了故障诊断的精度。通过齿轮箱故障模拟试验验证了该方法的有效性。展开更多
针对高光谱图像存在“维数灾难”的问题,提出一种全局判别与局部稀疏保持的高光谱图像半监督特征提取算法(GLSSFE)。该算法通过LDA算法的散度矩阵保存有类标样本的全局类内判别信息和全局类间判别信息,结合利用半监督PCA算法对有类标和...针对高光谱图像存在“维数灾难”的问题,提出一种全局判别与局部稀疏保持的高光谱图像半监督特征提取算法(GLSSFE)。该算法通过LDA算法的散度矩阵保存有类标样本的全局类内判别信息和全局类间判别信息,结合利用半监督PCA算法对有类标和无类标样本进行主成分分析,保存样本的全局结构;利用稀疏表示优化模型自适应揭示样本数据间的非线性结构,将局部类间判别权值和局部类内判别权值嵌入半监督LPP 算法保留样本数据的局部结构,从而最大化同类样本的相似性和异类样本的差异性。通过1-NN和SVM两个分类器分别对Indian Pines和Pavia University 两个公共高光谱图像数据集进行分类,验证所提特征提取方法的有效性。实验结果表明,该GLSSFE算法最高总体分类精度分别达到89.10%和92.09%,优于现有的特征提取算法,能有效地挖掘高光谱图像的全局特征和局部特征,极大地提升高光谱图像的地物分类效果。展开更多
在实际语音情感识别系统中,训练语音和测试语音往往来自不同的语料库,识别率下降显著。针对这一问题,该文提出一种有效的基于特征迁移学习的跨库语音情感识别方法。引入最大均值差异(maximum mean discrepancy,MMD)来描述不同数据库...在实际语音情感识别系统中,训练语音和测试语音往往来自不同的语料库,识别率下降显著。针对这一问题,该文提出一种有效的基于特征迁移学习的跨库语音情感识别方法。引入最大均值差异(maximum mean discrepancy,MMD)来描述不同数据库情感特征分布之间的相似度,并通过最大均值差异嵌入(maximum mean discrepancy embedding,MMDE)算法及特征降维算法来寻找二者之间的邻近低维特征空间,并在此低维空间中训练得到情感分类器用于情感识别。同时为了更好地保证情感信息的类别区分度,进一步引入半监督判别分析(semi-supervised discriminant analysis,SDA)方法用于特征降维。最后在2个经典语音情感数据库上对提出的方法进行实验评价,实验结果表明:提出的方法可以有效提高跨库条件下的语音情感识别率。展开更多
文摘为解决传统机器学习中训练集(源域)与测试集(目标域)数据分布不一致导致分类准确率较低的问题,提出一种基于半监督判别分析和CDMD的领域自适应算法(SDA-CDMD)。首先,使用半监督判别分析(SDA)进行数据降维,保留了映射到低维子空间中数据的几何结构信息。其次,提出一种衡量两个域之间分布差异的度量准则:跨域均值差异(Cross-Domain Mean Discrepancy,CDMD)。最后,将SDA与CDMD结合,将两个域投影到同一子空间中,减少两个域之间的分布差异。在手写数字图像和计算机视觉数据集上进行的大量实验结果表明,所提算法优于传统的领域自适应方法,验证了其有效性。
文摘大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性.
基金The National Natural Science Foundation of China(No.61231002,61273266)the Ph.D.Programs Foundation of Ministry of Education of China(No.20110092130004)
文摘针对有标记故障样本不足和故障特征集维数过高的问题,提出基于正交半监督局部Fisher判别分析(Orthogonal semi-supervised local Fisher discriminant analysis,OSELF)的故障诊断方法。所提出的OSELF能够充分地利用蕴含于无标记故障样本中的故障信息,避免了因有标记故障样本不足引起的过学习问题,同时采用正交迭代方式求解最优正交映射矩阵,克服现有方法无法得到正交映射矩阵的不足。正交映射矩阵的基矢量统计不相关,可有效地提高所得低维特征矢量的可辨识性。通过正交映射矩阵对故障样本集和新增样本进行维数约简,并将维数约简的结果输入粗糙优化k最近邻分类器(Coarse to fine k nearest neighbor classifier,CFKNNC)进行学习训练和故障识别。所提方法集成了OSELF在维数约简和CFKNNC在模式识别的优势,有效地提高了故障诊断的精度。通过齿轮箱故障模拟试验验证了该方法的有效性。
文摘针对高光谱图像存在“维数灾难”的问题,提出一种全局判别与局部稀疏保持的高光谱图像半监督特征提取算法(GLSSFE)。该算法通过LDA算法的散度矩阵保存有类标样本的全局类内判别信息和全局类间判别信息,结合利用半监督PCA算法对有类标和无类标样本进行主成分分析,保存样本的全局结构;利用稀疏表示优化模型自适应揭示样本数据间的非线性结构,将局部类间判别权值和局部类内判别权值嵌入半监督LPP 算法保留样本数据的局部结构,从而最大化同类样本的相似性和异类样本的差异性。通过1-NN和SVM两个分类器分别对Indian Pines和Pavia University 两个公共高光谱图像数据集进行分类,验证所提特征提取方法的有效性。实验结果表明,该GLSSFE算法最高总体分类精度分别达到89.10%和92.09%,优于现有的特征提取算法,能有效地挖掘高光谱图像的全局特征和局部特征,极大地提升高光谱图像的地物分类效果。
文摘在实际语音情感识别系统中,训练语音和测试语音往往来自不同的语料库,识别率下降显著。针对这一问题,该文提出一种有效的基于特征迁移学习的跨库语音情感识别方法。引入最大均值差异(maximum mean discrepancy,MMD)来描述不同数据库情感特征分布之间的相似度,并通过最大均值差异嵌入(maximum mean discrepancy embedding,MMDE)算法及特征降维算法来寻找二者之间的邻近低维特征空间,并在此低维空间中训练得到情感分类器用于情感识别。同时为了更好地保证情感信息的类别区分度,进一步引入半监督判别分析(semi-supervised discriminant analysis,SDA)方法用于特征降维。最后在2个经典语音情感数据库上对提出的方法进行实验评价,实验结果表明:提出的方法可以有效提高跨库条件下的语音情感识别率。