自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论...自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。展开更多
目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(var...目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。展开更多
为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(...为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。展开更多
为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用...为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。展开更多
文摘自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。
文摘目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。
文摘为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。
文摘为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。
文摘采用顶空固相微萃取(headspace solid-phase microextraction,HS-SPME)结合气相色谱-质谱联用仪(gas chromatography-mass spectrometry,GC-MS)分别对普洱市5个产茶区的普洱生茶香气组分进行分析。结果表明,42个普洱生茶样品中共检测出83种香气成分,其中醇类化合物23种,碳氢类化合物20种,酯类化合物12种,甲氧基苯类化合物8种,酮类化合物8种,酸类化合物4种,酚类化合物3种,醛类化合物3种,含氮类化合物2种。不同产茶区普洱生茶中醇类、碳氢类和醛类化合物相对百分含量差异均不显著,甲氧基苯类化合物含量差异显著性比例较大,酯类、酮类、酚类、酸类和含氮类化合物含量差异显著性比例较小。以83种香气成分相对百分含量为变量进行偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA),不同产茶区的普洱生茶样品呈现明显的分离趋势,变量重要性因子(variable importance in the projection,VIP)分析,33种香气成分对不同产茶区普洱生茶样品区分起主要作用(VIP> 1),33种香气成分中甲氧基苯类、酮类、酯类和醇类物质占比最大。