针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,...针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,逆系统软测量模型具有不惟一性,且难以得到精确的表达式。文中提出采用VIP方法对逆系统软测量模型的辅助变量进行优选,以对主变量贡献率较高的变量作为软测量模型的辅助变量,离线采集发酵过程各变量值,训练神经网络近似逆系统软测量模型,得到优化的神经网络逆系统软测量模型,实现发酵过程中菌体浓度和基质浓度的在线估计。利用Pensim平台采集数据,对所提方法做了仿真实验,结果表明:经过优化辅助变量的神经网络逆系统软测量方法具有更高的估计精度和泛化能力。展开更多
为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用...为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。展开更多
自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论...自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。展开更多
合理考虑关键环境量对效应量影响的大坝安全监控模型是大坝安全运行性态在线监控的前提和基础。其中原理简单、计算便捷的加权面积法和灰色关联分析法的理论相对成熟,在关键影响因子识别中应用最为广泛,但其存在稳定性差、抗噪能力弱等...合理考虑关键环境量对效应量影响的大坝安全监控模型是大坝安全运行性态在线监控的前提和基础。其中原理简单、计算便捷的加权面积法和灰色关联分析法的理论相对成熟,在关键影响因子识别中应用最为广泛,但其存在稳定性差、抗噪能力弱等问题。因此,提出了变量投影重要性(Variable Importance for Projection,VIP)改进分析法,该方法引入主成分分析和典型相关分析进行信息分解和筛选,结合偏最小二乘回归的优点,能对因子的变化作出合理、符合客观实际的物理成因解释,并以工程实例校验其有效性。应用表明,改进的变量投影重要性分析法具备良好的适用性及抗噪能力,对测点关键影响因子的识别更具稳定性和合理性,有效提高了关键影响因子识别的可靠性。展开更多
目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(var...目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。展开更多
极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高...极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。展开更多
为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(...为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。展开更多
文摘针对生物发酵过程中生化变量难以在线检测的问题,提出一种基于变量投影重要性(Variable importance in the project,VIP)方法优化的神经网络逆系统软测量模型。根据逆系统理论建立发酵过程生化变量的软测量模型,由于发酵系统的复杂性,逆系统软测量模型具有不惟一性,且难以得到精确的表达式。文中提出采用VIP方法对逆系统软测量模型的辅助变量进行优选,以对主变量贡献率较高的变量作为软测量模型的辅助变量,离线采集发酵过程各变量值,训练神经网络近似逆系统软测量模型,得到优化的神经网络逆系统软测量模型,实现发酵过程中菌体浓度和基质浓度的在线估计。利用Pensim平台采集数据,对所提方法做了仿真实验,结果表明:经过优化辅助变量的神经网络逆系统软测量方法具有更高的估计精度和泛化能力。
文摘为了实现利用较少的工程信息,快速准确的估计出工程项目的造价,提出了一种基于Adaboost-VIP的工程造价估计方法。首先采用变量投影重要性指标(variable importance in projection,VIP)法对影响工程造价的多个因素进行特征提取,然后利用最小二乘支持向量机作为非线性逼近器,建立工程造价的估计模型。为了进一步提高模型的估计精度,将自适应提升算法(Adaboost)与VIP相结合,利用Adaboost将多个弱造价估计模型进行集成,得到强造价估计模型。同时将该方法应用到建筑案例中,结果表明:VIP方法能有效地对影响因素进行筛选,简化模型结构;Adaboost-VIP模型与单一的工程造价估计模型相比,具有更高的估计性能。
文摘自变量筛选是定量光谱分析领域的研究热点,简便且高效的自变量筛选方法不但可以降低分析计算量,提高分析精度,同时还可以减轻对仪器光谱分辨能力的依赖,降低分析成本。波长筛选也是光谱法无创血液成分检测研究的重要环节。动态光谱理论为血液无创检测提供了极佳的思路,但长期局限于使用宽带光源和高分辨率的光谱仪器,分析中需要大量波长限制了动态光谱法的进一步发展。为了去除冗余信息,使检测走向低成本化和集成化,提出了基于变量投影重要性(variable importance in projection,VIP)分析的波长筛选方法。通过分析PLS模型中各维自变量对因变量的解释能力,从而剔除重要性较低的变量保留解释能力强的波长。以232例受试者的临床实验数据为基础,以血红蛋白含量为分析对象,经投影重要性分析后将波长数由586降至64,波长筛选后血红蛋白预测模型的测试集平均相对误差(MREP)为1.82%,使用了极少的波长便可得到满意的结果;结合Bootstrap方法对模型进行显著性检验后验证了波长变量的解释能力。首次指出了使用动态光谱法检测血红蛋白的敏感波长带。基于投影重要性分析的波长筛选迈出了动态光谱走向实用的重要一步,为实现低成本在线分析打下了基础,同时也为其他领域的光谱分析提供了重要的参考和新的思路。
文摘合理考虑关键环境量对效应量影响的大坝安全监控模型是大坝安全运行性态在线监控的前提和基础。其中原理简单、计算便捷的加权面积法和灰色关联分析法的理论相对成熟,在关键影响因子识别中应用最为广泛,但其存在稳定性差、抗噪能力弱等问题。因此,提出了变量投影重要性(Variable Importance for Projection,VIP)改进分析法,该方法引入主成分分析和典型相关分析进行信息分解和筛选,结合偏最小二乘回归的优点,能对因子的变化作出合理、符合客观实际的物理成因解释,并以工程实例校验其有效性。应用表明,改进的变量投影重要性分析法具备良好的适用性及抗噪能力,对测点关键影响因子的识别更具稳定性和合理性,有效提高了关键影响因子识别的可靠性。
文摘目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。
文摘极限学习机理论(extreme learning machine,ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。
文摘为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。