提出了一种基于稳定竞争自适应重加权采样(stability competitive adaptive reweighted sampling,SCARS)的无标模型传递方法。利用有用信息标准即稳定度指数(定义为回归系数除以其标准偏差的绝对值)和传递后的预测均方根误差(root mean ...提出了一种基于稳定竞争自适应重加权采样(stability competitive adaptive reweighted sampling,SCARS)的无标模型传递方法。利用有用信息标准即稳定度指数(定义为回归系数除以其标准偏差的绝对值)和传递后的预测均方根误差(root mean squared error of prediction,RMSEP),选择重要的、受测样参数影响不敏感的波长变量,能够消除或减少不同仪器或测量条件对样本信息反应差异,提高模型传递效果。此外,在该方法中,光谱变量被压缩、降维,从而使模型传递更稳定。采用该方法对谷物的近红外光谱分析模型在不同仪器之间进行传递研究。结果表明,该方法能消除仪器间的大部分差异,较好地实现模型传递效果。与正交信号校正法(orthogonal signal correction,OSC)、蒙特卡罗结合无用信息变量消除法(Monte Carlo uninformative variable elimination,MCUVE)、竞争自适应重加权采样法(competitive adaptive reweighted sampling,CARS)的比较表明,SCARS不仅在传递精度上能取得比OSC、MCUVE及CARS更好的效果,而且能有效地对光谱数据进行压缩,简化并优化传递过程。展开更多
选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加...选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加权算法(CARS)对不同变换下芦苇LAI特征光谱波段予以筛选,进而用筛选的特征波段采用逐波段组合法(BCI)构建芦苇LAI敏感光谱指数,利用随机森林(RF)、极端梯度提升(XGBoost)以及支持向量机(SVM)回归算法,构建芦苇LAI的高光谱估算模型。结果表明,采用CARS算法筛选不同变换光谱的特征波段构建模型,发现经过FD变换(R~2=0.417,RMSE=0.905)的模型效果最优。在CARS基础上使用筛选过后的特征波段构建植被指数进行建模比较,模型效果最好的是XGBoost(R2=0.620,RMSE=0.826)。展开更多
为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测...为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测模型。使用决定系数(R^(2))和预测均方误差(root mean square error of prediction,RMSEP)评价模型性能。光谱中含有大量冗余信息,为有效提升黄水淀粉含量检测精度和优化模型效率,将不同特征提取方法的优点结合,发现使用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)结合连续投影算法(successive projections algorithm,SPA)提取的光谱特征所建立的PLSR模型,相较于未使用特征提取或仅使用单一特征提取所建立的模型均有明显提升。在单一使用CARS时,模型的R^(2)为0.9654,RMSEP为0.2012%,而结合SPA后,R2为0.9738,RMSEP为0.1748%。此外,光谱维度从2203个减少到了126个,不仅提高了预测精度,也提升了建模效率。本研究提出的方法可作为黄水近红外定量模型优化的有效途径。展开更多
文摘提出了一种基于稳定竞争自适应重加权采样(stability competitive adaptive reweighted sampling,SCARS)的无标模型传递方法。利用有用信息标准即稳定度指数(定义为回归系数除以其标准偏差的绝对值)和传递后的预测均方根误差(root mean squared error of prediction,RMSEP),选择重要的、受测样参数影响不敏感的波长变量,能够消除或减少不同仪器或测量条件对样本信息反应差异,提高模型传递效果。此外,在该方法中,光谱变量被压缩、降维,从而使模型传递更稳定。采用该方法对谷物的近红外光谱分析模型在不同仪器之间进行传递研究。结果表明,该方法能消除仪器间的大部分差异,较好地实现模型传递效果。与正交信号校正法(orthogonal signal correction,OSC)、蒙特卡罗结合无用信息变量消除法(Monte Carlo uninformative variable elimination,MCUVE)、竞争自适应重加权采样法(competitive adaptive reweighted sampling,CARS)的比较表明,SCARS不仅在传递精度上能取得比OSC、MCUVE及CARS更好的效果,而且能有效地对光谱数据进行压缩,简化并优化传递过程。
文摘选取典型芦苇湿地基于芦苇叶片实测高光谱数据和叶面积指数(Leaf Area Index,LAI),在原始光谱的基础上进行了平滑(R)、一阶微分(FD)、倒数(RT)、对数(LT)、倒数一阶微分(RTFD)、对数一阶微分(LTFD)等六种光谱变换,利用竞争性自适应重加权算法(CARS)对不同变换下芦苇LAI特征光谱波段予以筛选,进而用筛选的特征波段采用逐波段组合法(BCI)构建芦苇LAI敏感光谱指数,利用随机森林(RF)、极端梯度提升(XGBoost)以及支持向量机(SVM)回归算法,构建芦苇LAI的高光谱估算模型。结果表明,采用CARS算法筛选不同变换光谱的特征波段构建模型,发现经过FD变换(R~2=0.417,RMSE=0.905)的模型效果最优。在CARS基础上使用筛选过后的特征波段构建植被指数进行建模比较,模型效果最好的是XGBoost(R2=0.620,RMSE=0.826)。
文摘为提高白酒固态发酵的副产物黄水中淀粉含量预测模型精度和建模效率。采用傅里叶变换近红外光谱仪采集黄水光谱信息,利用一阶导数对光谱进行预处理,并结合偏最小二乘回归(partial least squares regression,PLSR)建立黄水淀粉定量预测模型。使用决定系数(R^(2))和预测均方误差(root mean square error of prediction,RMSEP)评价模型性能。光谱中含有大量冗余信息,为有效提升黄水淀粉含量检测精度和优化模型效率,将不同特征提取方法的优点结合,发现使用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)结合连续投影算法(successive projections algorithm,SPA)提取的光谱特征所建立的PLSR模型,相较于未使用特征提取或仅使用单一特征提取所建立的模型均有明显提升。在单一使用CARS时,模型的R^(2)为0.9654,RMSEP为0.2012%,而结合SPA后,R2为0.9738,RMSEP为0.1748%。此外,光谱维度从2203个减少到了126个,不仅提高了预测精度,也提升了建模效率。本研究提出的方法可作为黄水近红外定量模型优化的有效途径。