变量选择方法可以实现对高维数据的降维,降低标定模型的复杂度以及提高模型的预测能力和可解释性,对建立高效可靠的预测模型具有重要意义。本文将模型种群分析(Model Population Analysis,MPA)用于近红外光谱标定建模过程的变量选择,结...变量选择方法可以实现对高维数据的降维,降低标定模型的复杂度以及提高模型的预测能力和可解释性,对建立高效可靠的预测模型具有重要意义。本文将模型种群分析(Model Population Analysis,MPA)用于近红外光谱标定建模过程的变量选择,结合MPA在同一空间反复抽取子集的特点,提出一种子集索引重用核-偏最小二乘(Subset Index Reuse Kernel-Partial Least Squares,SIRK-PLS)融合建模方法。该方法通过对预先计算的协方差矩阵进行索引,从本质上避免MPA框架下变量选择子集交叉验证和回归系数求解过程中的冗余计算,提高建模效率。此外,SIRK-PLS建模方法可以根据样本数和变量数的比例,实现建模算法的自动最优切换。通过标称近红外光谱玉米数据集对算法性能进行验证。结果表明,本文提出的SIRK-PLS建模方法收敛速度快、精度高,适用于移动红外光谱设备的自动快速降维建模,具有一定的应用前景。展开更多
文摘变量选择方法可以实现对高维数据的降维,降低标定模型的复杂度以及提高模型的预测能力和可解释性,对建立高效可靠的预测模型具有重要意义。本文将模型种群分析(Model Population Analysis,MPA)用于近红外光谱标定建模过程的变量选择,结合MPA在同一空间反复抽取子集的特点,提出一种子集索引重用核-偏最小二乘(Subset Index Reuse Kernel-Partial Least Squares,SIRK-PLS)融合建模方法。该方法通过对预先计算的协方差矩阵进行索引,从本质上避免MPA框架下变量选择子集交叉验证和回归系数求解过程中的冗余计算,提高建模效率。此外,SIRK-PLS建模方法可以根据样本数和变量数的比例,实现建模算法的自动最优切换。通过标称近红外光谱玉米数据集对算法性能进行验证。结果表明,本文提出的SIRK-PLS建模方法收敛速度快、精度高,适用于移动红外光谱设备的自动快速降维建模,具有一定的应用前景。