近红外光谱数据高度线性相关且含有大量的冗余信息.通过选择重要的特征变量代替全谱变量,能够有效提高近红外模型的预测精度.本文将变量重要性融入到偏最小二乘回归中,提出了一种新的基于变量重要性的偏最小二乘特征变量筛选方法(VISPL...近红外光谱数据高度线性相关且含有大量的冗余信息.通过选择重要的特征变量代替全谱变量,能够有效提高近红外模型的预测精度.本文将变量重要性融入到偏最小二乘回归中,提出了一种新的基于变量重要性的偏最小二乘特征变量筛选方法(VISPLS),它是基于变量重要性的前向迭代算法.通过选择斯皮尔曼(Spearman)相关系数、肯德尔(Kendall)相关系数、选择性比(selectivity ratio,SR)和投影变量重要性(variable importance in projection,VIP)4个指标来度量近红外光谱变量的重要性,并用2个真实的近红外光谱数据集来评估VISPLS的性能.研究结果表明,与SpearmanPLS,KendallPLS和SRPLS这3种算法比较,VIPPLS算法有更好的预测性能.展开更多
介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长...介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长期负荷预测模型。该方法能有效地去除自变量系统中与因变量无关的正交数据信息,增强自变量、因变量之间的相关性,在有限的成分中提高成分解释能力。通过算例将PLS与OSC-PLS进行比较分析,结果表明,运用OSC-PLS进行中长期负荷预测,尽管预测模型提取的成分个数变少了,但模型成分的解释性却大幅度增强,预测精度明显提高,具有较强的实用性。展开更多
文摘近红外光谱数据高度线性相关且含有大量的冗余信息.通过选择重要的特征变量代替全谱变量,能够有效提高近红外模型的预测精度.本文将变量重要性融入到偏最小二乘回归中,提出了一种新的基于变量重要性的偏最小二乘特征变量筛选方法(VISPLS),它是基于变量重要性的前向迭代算法.通过选择斯皮尔曼(Spearman)相关系数、肯德尔(Kendall)相关系数、选择性比(selectivity ratio,SR)和投影变量重要性(variable importance in projection,VIP)4个指标来度量近红外光谱变量的重要性,并用2个真实的近红外光谱数据集来评估VISPLS的性能.研究结果表明,与SpearmanPLS,KendallPLS和SRPLS这3种算法比较,VIPPLS算法有更好的预测性能.
文摘介绍正交信号修正法的基本思想并详细推导该算法的实现步骤,将一种改进后的正交信号修正法(orthogonal signal correction,OSC)与偏最小二乘法(partial least square method,PLS)相结合,对原始数据通过OSC消除正交分量,利用PLS建立中长期负荷预测模型。该方法能有效地去除自变量系统中与因变量无关的正交数据信息,增强自变量、因变量之间的相关性,在有限的成分中提高成分解释能力。通过算例将PLS与OSC-PLS进行比较分析,结果表明,运用OSC-PLS进行中长期负荷预测,尽管预测模型提取的成分个数变少了,但模型成分的解释性却大幅度增强,预测精度明显提高,具有较强的实用性。