为了进一步提高pAUC(Partial area under curve)估计精度和医学诊断测试精确性,提出了一种基于密度比模型的pAUC半参数估计方法,并从理论和仿真两个方面研究其性质。首先,根据密度比模型,用半参数极大似然估计方法得到了pAUC半参数估计...为了进一步提高pAUC(Partial area under curve)估计精度和医学诊断测试精确性,提出了一种基于密度比模型的pAUC半参数估计方法,并从理论和仿真两个方面研究其性质。首先,根据密度比模型,用半参数极大似然估计方法得到了pAUC半参数估计量,并用大样本理论分析了它的统计性能;然后,对pAUC半参数估计方法在实际应用中的性能进行了仿真,并与现有精度较高的pAUC非参数估计方法进行比较。研究发现,pAUC半参数估计量不仅具有相合渐近正态性等重要的统计性质,而且比已有的非参数pAUC估计量具有更高的渐近估计效率和精确度。将该pAUC半参数估计方法应用于乳腺癌诊断模型的筛选,得到了一个预测精度更高的新乳腺癌诊断模型,结果表明该方法在实际应用中能提高医学诊断测试的精度。展开更多
现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood ...现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood Components Analysis)度量学习方法的基础上,通过引入概率密度比值对目标函数加权,提出了一种采用概率密度比值估计的距离度量学习方法(Distance metric learning with ProbabilityDensity Ratio Estimation,DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。展开更多
文摘为了进一步提高pAUC(Partial area under curve)估计精度和医学诊断测试精确性,提出了一种基于密度比模型的pAUC半参数估计方法,并从理论和仿真两个方面研究其性质。首先,根据密度比模型,用半参数极大似然估计方法得到了pAUC半参数估计量,并用大样本理论分析了它的统计性能;然后,对pAUC半参数估计方法在实际应用中的性能进行了仿真,并与现有精度较高的pAUC非参数估计方法进行比较。研究发现,pAUC半参数估计量不仅具有相合渐近正态性等重要的统计性质,而且比已有的非参数pAUC估计量具有更高的渐近估计效率和精确度。将该pAUC半参数估计方法应用于乳腺癌诊断模型的筛选,得到了一个预测精度更高的新乳腺癌诊断模型,结果表明该方法在实际应用中能提高医学诊断测试的精度。
文摘现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA(Neighbourhood Components Analysis)度量学习方法的基础上,通过引入概率密度比值对目标函数加权,提出了一种采用概率密度比值估计的距离度量学习方法(Distance metric learning with ProbabilityDensity Ratio Estimation,DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。