酸度是评价砂糖橘品质的重要指标之一,为了消除光谱变量间的共线性影响、减少建模变量以提高校正速度,该文应用连续投影算法(SPA)对砂糖橘总酸近红外光谱无损检测模型进行优化。利用连接点修正方法修正近红外光谱,结合学生化残差图和模...酸度是评价砂糖橘品质的重要指标之一,为了消除光谱变量间的共线性影响、减少建模变量以提高校正速度,该文应用连续投影算法(SPA)对砂糖橘总酸近红外光谱无损检测模型进行优化。利用连接点修正方法修正近红外光谱,结合学生化残差图和模型回归图剔除异常样本,利用SPXY(sample set partitioning based on joint x-y distances)方法划分样本集,最后利用SPA进行变量选择,比较SPA选择的变量建模和全光谱变量PLS模型的预测效果,并分析橘皮对总酸模型的预测精度的影响程度。结果表明,只用了全部2001个变量中的9个变量,整果测定酸度情况下的SPA-MLR模型和SPA-PLS模型的预测精度与全部变量PLS模型的预测精度相当,预测相关系数Rp分别为0.829470,0.837095和0.857299。去皮留果肉测定酸度情况下则优选了13个变量,其SPA-MLR模型和SPA-PLS模型的Rp分别为0.819430、0.825277,均比全光谱变量PLS模型的Rp(0.780146)高,SPA算法提高了去皮留果肉测定酸度情况下的模型预测精度。展开更多
采用全谱建立多元校正模型时,通常计算量大,模型不够稳健,而且模型的预测精度往往也不能达到最优。文章介绍一种新的波长选择方法:采用连续投影算法(successive projections algorithm),并将其集成偏最小二乘(partial least squares)多...采用全谱建立多元校正模型时,通常计算量大,模型不够稳健,而且模型的预测精度往往也不能达到最优。文章介绍一种新的波长选择方法:采用连续投影算法(successive projections algorithm),并将其集成偏最小二乘(partial least squares)多变量校正技术构成SPA-PLS方法,用于谷物小麦近红外光谱波长优化选择及其与水分含量的定量分析。结果表明:在经SPA算法后,光谱波数可削减97.72%,后继的定量校正模型结构得到显著简化,模型的稳健性也大大增强;同时,被选取的波长物理意义明确,模型的解释能力增强,而模型的预测性能也与GA-PLS方法相当。展开更多
文摘酸度是评价砂糖橘品质的重要指标之一,为了消除光谱变量间的共线性影响、减少建模变量以提高校正速度,该文应用连续投影算法(SPA)对砂糖橘总酸近红外光谱无损检测模型进行优化。利用连接点修正方法修正近红外光谱,结合学生化残差图和模型回归图剔除异常样本,利用SPXY(sample set partitioning based on joint x-y distances)方法划分样本集,最后利用SPA进行变量选择,比较SPA选择的变量建模和全光谱变量PLS模型的预测效果,并分析橘皮对总酸模型的预测精度的影响程度。结果表明,只用了全部2001个变量中的9个变量,整果测定酸度情况下的SPA-MLR模型和SPA-PLS模型的预测精度与全部变量PLS模型的预测精度相当,预测相关系数Rp分别为0.829470,0.837095和0.857299。去皮留果肉测定酸度情况下则优选了13个变量,其SPA-MLR模型和SPA-PLS模型的Rp分别为0.819430、0.825277,均比全光谱变量PLS模型的Rp(0.780146)高,SPA算法提高了去皮留果肉测定酸度情况下的模型预测精度。
文摘采用全谱建立多元校正模型时,通常计算量大,模型不够稳健,而且模型的预测精度往往也不能达到最优。文章介绍一种新的波长选择方法:采用连续投影算法(successive projections algorithm),并将其集成偏最小二乘(partial least squares)多变量校正技术构成SPA-PLS方法,用于谷物小麦近红外光谱波长优化选择及其与水分含量的定量分析。结果表明:在经SPA算法后,光谱波数可削减97.72%,后继的定量校正模型结构得到显著简化,模型的稳健性也大大增强;同时,被选取的波长物理意义明确,模型的解释能力增强,而模型的预测性能也与GA-PLS方法相当。
文摘应用连续投影算法(successive projections algorithm,SPA)选择由主成分分析(principal componentanalysis,PCA)得到主成分的最佳组合。首先对奶粉的短波近红外光谱进行PCA分析,然后通过SPA得到的脂肪和蛋白质含量预测最佳主成分组合分别为主成分1,2,4,5,6和7以及主成分1,2,3,4,5和8。通过最小二乘支持向量机(Least-squares support vector machine,LS-SVM)对奶粉中脂肪和蛋白质含量进行预测,SPA选择得到的主成分组合均优于分别采用前4个到前8个主成分。基于SPA得到的主成分组合得到脂肪含量预测结果的确定系数(Rp2),预测误差均方根(root mean square error for prediction,RMSEP)和剩余预测偏差(residual predictive deviation,RPD)分别为0.9890,0.1703和9.5343。而蛋白质含量预测结果的Rp2,RMSEP和RPD分别为0.9876,0.1348和8.9274。说明SPA能够用于快速有效选取最佳的主成分数,寻优过程简单快速,并且不用对大量参数进行调试。