目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(var...目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。展开更多
为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(...为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。展开更多
为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基...为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基于以往数次大修相关数据,预测试验专用装备使用期的某次大修成本。同时,为保持模型的稳健性,提高模型解释能力和预测精确度,尝试利用变量投影重要性分析对模型进行优化,取得了较好的效果。实例证明,该方法不仅能在多变量间存在严重多重相关性情况下建立模型,而且能够有效筛选与因变量关系不大的自变量,简化输入样本集。展开更多
针对污秽绝缘子红外热像特征数据具有多重相关性的特点,提出基于PLS(Partial Least Squares,PLS)回归分析的高压绝缘子污秽等级判定方法。在最大限度保留原有数据信息的前提下,建立起高压绝缘子污秽特征量与污秽等级之间的PLS回归模型方...针对污秽绝缘子红外热像特征数据具有多重相关性的特点,提出基于PLS(Partial Least Squares,PLS)回归分析的高压绝缘子污秽等级判定方法。在最大限度保留原有数据信息的前提下,建立起高压绝缘子污秽特征量与污秽等级之间的PLS回归模型方程,通过对回归模型方程进行变量投影重要性指标分析,可以得到各个特征量对污秽等级判定结果的影响程度。此方法有效解决了自变量之间的多重相关性问题,量化了污秽特征量与污秽等级之间的关系。测试结果表明,将PLS回归分析应用于高压绝缘子污秽等级的判定,科学可靠,准确率高,具有较强的实用性。展开更多
采用联合国政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)2006年版能源消耗碳排放计算公式和水泥生产碳排放模型,选取2005—2014年能源消费数据和水泥产量数据,计算并分析山东省10年间的碳排放量及其特征...采用联合国政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)2006年版能源消耗碳排放计算公式和水泥生产碳排放模型,选取2005—2014年能源消费数据和水泥产量数据,计算并分析山东省10年间的碳排放量及其特征,并通过偏最小二乘(PLS)回归模型,利用2005—2014年山东省社会经济统计数据对碳排放驱动因素进行研究。研究表明:燃料、动力类价格对碳排放具有显著的抑制作用,解释能力为0.894 3;其余变量与碳排放均呈正相关,其中人口增长、居民消费水平、地区生产总值、城市化率、外商直接投资对促进碳排放解释能力最为显著,其变量投影重要性分别为1.15、1.14、1.14、1.12和1.12;另外,技术创新、能源消费量、水泥产量、产业结构和能源结构对碳排放的促进作用也是非常重要的。通过上述研究成果,为相关政府部门制定节能减排政策提供参考。展开更多
文摘目的/意义研究一种均方根误差最小准则的偏最小二乘筛选中药药效物质方法,以便全面地观察和分析中药的作用机理。方法/过程以均方根误差(root mean square error,RMSE)最小为主要准则,通过偏最小二乘法获得特征的变量投影重要性指标(variable importance in the projection,VIP)值,再以VIP值的大小对特征重要性排序,最后通过偏最小回归法与前向搜索法,以RMSE最小、交叉性验证结果最好为标准,确定特征子集。采用大承气汤配比治疗急性胰腺炎实验数据,以及麻杏石甘汤治咳、平喘、退热实验数据进行验证。结果/结论该方法能得到回归性能最好时的最小RMSE和药效物质子集。VIP值大于1的特征是相对重要的,VIP值小于1的特征也可能对模型性能有影响。
文摘为了快速、准确地测定冬小麦植株氮含量,利用2014?2015年的冬小麦冠层反射光谱数据构建了16种氮素或叶绿素敏感光谱指数,基于变量投影重要性(variable importance projection,VIP)-偏最小二乘(partial least squares,PLS)-赤池信息准则(Akaike’s information criterion,AIC)整合模型构建了不同生育期植株氮含量最佳回归模型,并用2012?2013年挑旗期数据对模型进行了验证。结果表明:在AIC下,拔节期以4个植被指数为自变量的模型最优;挑旗期以5个植被指数为自变量的模型最优;开花期以4个植被指数为自变量的模型最优;灌浆期以6个植被指数为自变量的模型最优。4个生育期建模的决定系数(R2)和均方根误差(RMSE)分别为0.71、0.86、0.75、0.46和0.23%、0.13%、0.12%、0.15%,以挑旗期决定系数为最大。挑旗期验证集的R2和RMSE分别为0.81和0.41%,预测模型和验证模型均具有较高的估算精度和可靠性,研究结果为选择小麦合适的生育期估算小麦植株氮营养状况提供参考。
文摘为了科学预测试验装备修理成本,提高维修经费决策质量,引入偏最小二乘回归分析(Partial Least Squares Regression,PLSR)对试验装备修理成本进行预测。针对试验装备修理成本小样本、贫数据、特征量相关性强的不利条件,构建预测模型;基于以往数次大修相关数据,预测试验专用装备使用期的某次大修成本。同时,为保持模型的稳健性,提高模型解释能力和预测精确度,尝试利用变量投影重要性分析对模型进行优化,取得了较好的效果。实例证明,该方法不仅能在多变量间存在严重多重相关性情况下建立模型,而且能够有效筛选与因变量关系不大的自变量,简化输入样本集。
文摘针对污秽绝缘子红外热像特征数据具有多重相关性的特点,提出基于PLS(Partial Least Squares,PLS)回归分析的高压绝缘子污秽等级判定方法。在最大限度保留原有数据信息的前提下,建立起高压绝缘子污秽特征量与污秽等级之间的PLS回归模型方程,通过对回归模型方程进行变量投影重要性指标分析,可以得到各个特征量对污秽等级判定结果的影响程度。此方法有效解决了自变量之间的多重相关性问题,量化了污秽特征量与污秽等级之间的关系。测试结果表明,将PLS回归分析应用于高压绝缘子污秽等级的判定,科学可靠,准确率高,具有较强的实用性。
文摘采用顶空固相微萃取(headspace solid-phase microextraction,HS-SPME)结合气相色谱-质谱联用仪(gas chromatography-mass spectrometry,GC-MS)分别对普洱市5个产茶区的普洱生茶香气组分进行分析。结果表明,42个普洱生茶样品中共检测出83种香气成分,其中醇类化合物23种,碳氢类化合物20种,酯类化合物12种,甲氧基苯类化合物8种,酮类化合物8种,酸类化合物4种,酚类化合物3种,醛类化合物3种,含氮类化合物2种。不同产茶区普洱生茶中醇类、碳氢类和醛类化合物相对百分含量差异均不显著,甲氧基苯类化合物含量差异显著性比例较大,酯类、酮类、酚类、酸类和含氮类化合物含量差异显著性比例较小。以83种香气成分相对百分含量为变量进行偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA),不同产茶区的普洱生茶样品呈现明显的分离趋势,变量重要性因子(variable importance in the projection,VIP)分析,33种香气成分对不同产茶区普洱生茶样品区分起主要作用(VIP> 1),33种香气成分中甲氧基苯类、酮类、酯类和醇类物质占比最大。