现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood ...现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood Components Analysis)度量学习方法的基础上,通过引入概率密度比值对目标函数加权,提出了一种采用概率密度比值估计的距离度量学习方法(Distance metric learning with ProbabilityDensity Ratio Estimation,DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。展开更多
文摘现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood Components Analysis)度量学习方法的基础上,通过引入概率密度比值对目标函数加权,提出了一种采用概率密度比值估计的距离度量学习方法(Distance metric learning with ProbabilityDensity Ratio Estimation,DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。