【目的】快速、准确地监测土壤有机质对于精准农业的发展具有重要意义。可见光-近红外(visible and near-infrared,Vis-NIR)光谱技术在土壤属性估算、数字化土壤制图等方面应用较为广泛,然而,在田间进行光谱测量,易受土壤含水量(soil mo...【目的】快速、准确地监测土壤有机质对于精准农业的发展具有重要意义。可见光-近红外(visible and near-infrared,Vis-NIR)光谱技术在土壤属性估算、数字化土壤制图等方面应用较为广泛,然而,在田间进行光谱测量,易受土壤含水量(soil moisture,SM)、温度、土壤表面状况等因素的影响,导致光谱信息中包含大量干扰信息,其中,SM变化是影响光谱观测结果最为显著的因素之一。此研究的目的是探讨OSC算法消除其影响,提升Vis-NIR光谱定量估算土壤有机质(soil organic matter,SOM)的精度。【方法】以江汉平原公安县和潜江市为研究区域,采集217份耕层(0—20 cm)土壤样本,进行风干、研磨、过筛等处理,采用重铬酸钾-外加热法测定SOM;将总体样本划分为3个互不重叠的样本集:建模集S^0(122个样本)、训练集S^1(60个样本)、验证集S^2(35个样本);设计SM梯度试验(梯度间隔为4%),在实验室内获取S^1和S^2样本集的9个梯度SM(0%—32%)的土壤光谱数据;分析SM对土壤Vis-NIR光谱反射率的影响,采用外部参数正交化算法(external parameter orthogonalization,EPO)、正交信号校正算法(orthogonal signal correction,OSC)消除SM对土壤光谱的干扰;利用主成分分析(principal component analysis,PCA)的前两个主成分得分和光谱相关系数两种方法检验消除SM干扰前、后的效果;基于偏最小二乘回归(partial least squares regression,PLSR)方法建立EPO和OSC处理前、后的SOM估算模型,利用决定系数(coefficient of determination,R^2)、均方根误差(root mean square error,RMSE)和RPD(the ratio of prediction to deviation)3个指标比较PLSR、EPO-PLSR、OSC-PLSR模型的性能。【结果】土壤Vis-NIR光谱受SM的影响十分明显,随着SM的增加,土壤光谱反射率呈非线性降低趋势。OSC处理前的湿土光谱数据主成分得分散点相对分散,与干土光谱数据主成分得分空间的位置不重叠,不同SM梯度之间的光谱相关系数变化较大;OSC处理后的湿土光谱数据主成分得分空间的位置基本与干土光谱数据相重合,各样本光谱数据之间相似性很高,不同SM梯度之间的光谱相关系数变化较小。9个SM梯度的EPO-PLSR模型的验证平均R^2_(pre)、RPD分别为0.69、1.7。9个SM梯度的OSC-PLSR模型的验证平均R^2_(pre)、RPD分别为0.72、1.89,校正后的OSC-PLSR模型受SM的较小,有效提升SOM估算模型的精度和鲁棒性。【结论】OSC能够消除SM变化对土壤Vis-NIR光谱的影响,可为将来田间原位实时监测SOM信息提供一定的理论支撑。展开更多
A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with ...A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with small high-dimensional data of the Kernel Principal Component Analysis(KPCA)were used here to analyze four genotypes of the important model plant—Arabidopsis thaliana.In order to improve the performance of PR(Pattern Recognition),the Orthogonal Signal Correction(OSC)method was used to filter the original data firstly to eliminate the interference of noise.The PR results showed that the OSC-KPCA based PR method could reveal the underlying relationship between genotypes and metabolites successfully.The paternal genotypes(Co10 and C24)and the two F1 progeny C24×Co10 and Co10×C24 could be 100% correctly discriminated.More importantly the predictability was also as high as 100%.展开更多
探讨了基于不同数据预处理方法的正交信号校正在秸杆饲料近红外光谱模型传递中的应用。以141个秸杆青贮饲料样品为研究对象,以其粗蛋白含量为目标参数,研究了基于无处理、局部中心化、全局中心化和Z-score标准化预处理方法的正交信号校...探讨了基于不同数据预处理方法的正交信号校正在秸杆饲料近红外光谱模型传递中的应用。以141个秸杆青贮饲料样品为研究对象,以其粗蛋白含量为目标参数,研究了基于无处理、局部中心化、全局中心化和Z-score标准化预处理方法的正交信号校正,在源仪器(SPECTRUM ONE NTS)和目标仪器1(AN-TARIS)与目标仪器2(FOSS 6500)之间的模型传递效果。实验表明:对于两台傅里叶变换型近红外光谱仪,采用局部中心化、全局中心化和Z-score标准化预处理方法的正交信号校正均可成功实现模型传递,其中局部中心化和全局中心化法的作用效果基本一致,且优于Z-score标准化法。对于傅立叶变换和光栅型近红外光谱仪,全局中心化的作用效果明显优于其它3组处理效果,且只有全局中心化预处理的正交信号校正传递后的模型可用于实际预测。展开更多
该研究采用傅里叶变换红外光谱结合化学计量学,对条播、撒播、剪根后移栽、扦插和剪枝后移栽的滇龙胆进行了分析,以筛选滇龙胆的最佳栽培方式。结果表明:(1)不同栽培方式的滇龙胆原始谱图在峰形、峰位和峰强上有一定差异;用小波去噪法...该研究采用傅里叶变换红外光谱结合化学计量学,对条播、撒播、剪根后移栽、扦插和剪枝后移栽的滇龙胆进行了分析,以筛选滇龙胆的最佳栽培方式。结果表明:(1)不同栽培方式的滇龙胆原始谱图在峰形、峰位和峰强上有一定差异;用小波去噪法对光谱进行优化处理并进行偏最小二乘判别分析(Partial least squares discriminant analysis,PLS-DA),能较好地区分不同栽培方式的滇龙胆样品,PLS-DA二维得分图显示同一栽培方式的样品聚在一起,表明相同栽培方式的滇龙胆化学组成和含量差异较小;播种滇龙胆样品(条播和撒播)距离较近,移栽滇龙胆样品(剪根、扦插和剪枝)距离较近,而播种和移栽滇龙胆样品距离较远,表明栽培方式对滇龙胆化学成分的积累有影响。(2)滇龙胆四种主要成分总含量大小依次是剪枝>剪根>撒播>条播>扦插,除剪根后移栽,剪枝后移栽滇龙胆中四种主要成分总含量显著高于其他栽培方式下的滇龙胆(P<0.05),剪枝后移栽滇龙胆质量最佳。(3)以液相数据为参考值,采用正交信号校正—偏最小二乘回归模型预测不同栽培模式滇龙胆中龙胆苦苷、马钱苷酸、獐牙菜苦苷和当药苷的含量。校正集和验证集的决定系数(R2)均大于0.90,校正均方根误差、交叉验证均方差和预测均方根误差均小于1.65,模型相关性和预测效果好,该方法对红外光谱分析在中药领域的推广应用提供了参考。展开更多
文摘【目的】快速、准确地监测土壤有机质对于精准农业的发展具有重要意义。可见光-近红外(visible and near-infrared,Vis-NIR)光谱技术在土壤属性估算、数字化土壤制图等方面应用较为广泛,然而,在田间进行光谱测量,易受土壤含水量(soil moisture,SM)、温度、土壤表面状况等因素的影响,导致光谱信息中包含大量干扰信息,其中,SM变化是影响光谱观测结果最为显著的因素之一。此研究的目的是探讨OSC算法消除其影响,提升Vis-NIR光谱定量估算土壤有机质(soil organic matter,SOM)的精度。【方法】以江汉平原公安县和潜江市为研究区域,采集217份耕层(0—20 cm)土壤样本,进行风干、研磨、过筛等处理,采用重铬酸钾-外加热法测定SOM;将总体样本划分为3个互不重叠的样本集:建模集S^0(122个样本)、训练集S^1(60个样本)、验证集S^2(35个样本);设计SM梯度试验(梯度间隔为4%),在实验室内获取S^1和S^2样本集的9个梯度SM(0%—32%)的土壤光谱数据;分析SM对土壤Vis-NIR光谱反射率的影响,采用外部参数正交化算法(external parameter orthogonalization,EPO)、正交信号校正算法(orthogonal signal correction,OSC)消除SM对土壤光谱的干扰;利用主成分分析(principal component analysis,PCA)的前两个主成分得分和光谱相关系数两种方法检验消除SM干扰前、后的效果;基于偏最小二乘回归(partial least squares regression,PLSR)方法建立EPO和OSC处理前、后的SOM估算模型,利用决定系数(coefficient of determination,R^2)、均方根误差(root mean square error,RMSE)和RPD(the ratio of prediction to deviation)3个指标比较PLSR、EPO-PLSR、OSC-PLSR模型的性能。【结果】土壤Vis-NIR光谱受SM的影响十分明显,随着SM的增加,土壤光谱反射率呈非线性降低趋势。OSC处理前的湿土光谱数据主成分得分散点相对分散,与干土光谱数据主成分得分空间的位置不重叠,不同SM梯度之间的光谱相关系数变化较大;OSC处理后的湿土光谱数据主成分得分空间的位置基本与干土光谱数据相重合,各样本光谱数据之间相似性很高,不同SM梯度之间的光谱相关系数变化较小。9个SM梯度的EPO-PLSR模型的验证平均R^2_(pre)、RPD分别为0.69、1.7。9个SM梯度的OSC-PLSR模型的验证平均R^2_(pre)、RPD分别为0.72、1.89,校正后的OSC-PLSR模型受SM的较小,有效提升SOM估算模型的精度和鲁棒性。【结论】OSC能够消除SM变化对土壤Vis-NIR光谱的影响,可为将来田间原位实时监测SOM信息提供一定的理论支撑。
文摘A novel OSC-KPCA based pattern analysis method was proposed to improve the clustering and predictive performance of the metabolomics.The strong nonlinear pattern recognition power and the predominance in dealing with small high-dimensional data of the Kernel Principal Component Analysis(KPCA)were used here to analyze four genotypes of the important model plant—Arabidopsis thaliana.In order to improve the performance of PR(Pattern Recognition),the Orthogonal Signal Correction(OSC)method was used to filter the original data firstly to eliminate the interference of noise.The PR results showed that the OSC-KPCA based PR method could reveal the underlying relationship between genotypes and metabolites successfully.The paternal genotypes(Co10 and C24)and the two F1 progeny C24×Co10 and Co10×C24 could be 100% correctly discriminated.More importantly the predictability was also as high as 100%.
文摘探讨了基于不同数据预处理方法的正交信号校正在秸杆饲料近红外光谱模型传递中的应用。以141个秸杆青贮饲料样品为研究对象,以其粗蛋白含量为目标参数,研究了基于无处理、局部中心化、全局中心化和Z-score标准化预处理方法的正交信号校正,在源仪器(SPECTRUM ONE NTS)和目标仪器1(AN-TARIS)与目标仪器2(FOSS 6500)之间的模型传递效果。实验表明:对于两台傅里叶变换型近红外光谱仪,采用局部中心化、全局中心化和Z-score标准化预处理方法的正交信号校正均可成功实现模型传递,其中局部中心化和全局中心化法的作用效果基本一致,且优于Z-score标准化法。对于傅立叶变换和光栅型近红外光谱仪,全局中心化的作用效果明显优于其它3组处理效果,且只有全局中心化预处理的正交信号校正传递后的模型可用于实际预测。
文摘该研究采用傅里叶变换红外光谱结合化学计量学,对条播、撒播、剪根后移栽、扦插和剪枝后移栽的滇龙胆进行了分析,以筛选滇龙胆的最佳栽培方式。结果表明:(1)不同栽培方式的滇龙胆原始谱图在峰形、峰位和峰强上有一定差异;用小波去噪法对光谱进行优化处理并进行偏最小二乘判别分析(Partial least squares discriminant analysis,PLS-DA),能较好地区分不同栽培方式的滇龙胆样品,PLS-DA二维得分图显示同一栽培方式的样品聚在一起,表明相同栽培方式的滇龙胆化学组成和含量差异较小;播种滇龙胆样品(条播和撒播)距离较近,移栽滇龙胆样品(剪根、扦插和剪枝)距离较近,而播种和移栽滇龙胆样品距离较远,表明栽培方式对滇龙胆化学成分的积累有影响。(2)滇龙胆四种主要成分总含量大小依次是剪枝>剪根>撒播>条播>扦插,除剪根后移栽,剪枝后移栽滇龙胆中四种主要成分总含量显著高于其他栽培方式下的滇龙胆(P<0.05),剪枝后移栽滇龙胆质量最佳。(3)以液相数据为参考值,采用正交信号校正—偏最小二乘回归模型预测不同栽培模式滇龙胆中龙胆苦苷、马钱苷酸、獐牙菜苦苷和当药苷的含量。校正集和验证集的决定系数(R2)均大于0.90,校正均方根误差、交叉验证均方差和预测均方根误差均小于1.65,模型相关性和预测效果好,该方法对红外光谱分析在中药领域的推广应用提供了参考。