期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
Prediction of Rural Residents’ Consumption Expenditure Based on Lasso and Adaptive Lasso Methods 被引量:1
1
作者 Xiaoting Tao Haomin Zhang 《Open Journal of Statistics》 2016年第6期1166-1173,共8页
When the variable of model is large, the Lasso method and the Adaptive Lasso method can effectively select variables. This paper prediction the rural residents’ consumption expenditure in China, based on respectively... When the variable of model is large, the Lasso method and the Adaptive Lasso method can effectively select variables. This paper prediction the rural residents’ consumption expenditure in China, based on respectively using the Lasso method and the Adaptive Lasso method. The results showed that both can effectively and accurately choose the appropriate variable, but the Adaptive Lasso method is better than the Lasso method in prediction accuracy and prediction error. It shows that in variable selection and parameter estimation, Adaptive Lasso method is better than the Lasso method. 展开更多
关键词 lasso method Adaptive lasso method CONSUMPTION PREDICTION
下载PDF
基于Lasso和Xgboost的油价预测研究 被引量:12
2
作者 施国良 景志刚 范丽伟 《工业技术经济》 CSSCI 北大核心 2018年第7期31-37,共7页
鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期... 鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期货价格、中国原油产量等11个主要影响因素,之后使用Xgboost方法对油价进行预测。数值试验结果表明,相比较其它预测方法,本文构建的Lasso-Xgboost组合方法预测精度更高,泛化能力更强。最后本文应用已有模型对2018~2019年WTI原油价格进行趋势预测。 展开更多
关键词 lasso方法 Xgboost方法 lasso-Xgboost方法 WTI现货价格预测 模型误差 分类与回归树
下载PDF
基于Lasso和BP神经网络的组合预测及其应用——以居民消费支出预测为例 被引量:11
3
作者 喻胜华 张静 《财经理论与实践》 CSSCI 北大核心 2016年第1期123-128,共6页
在变量选择的基础上,构建基于Lasso方法和BP神经网络的预测模型,并对我国城乡居民的消费支出进行预测,结果显示:基于Lasso方法和BP神经网络的组合预测精度要明显高于BP神经网络、Lasso方法的预测精度;在2014~2020年,我国农村居民消费... 在变量选择的基础上,构建基于Lasso方法和BP神经网络的预测模型,并对我国城乡居民的消费支出进行预测,结果显示:基于Lasso方法和BP神经网络的组合预测精度要明显高于BP神经网络、Lasso方法的预测精度;在2014~2020年,我国农村居民消费增长率有所提升,城镇居民消费增长率减缓,城乡居民消费增长率之间的差距呈下降趋势,但短期内城乡居民消费差距依然难以缓和。 展开更多
关键词 消费 lasso方法 BP神经网络 预测
下载PDF
基于Bayesian Lasso方法的变量选择和异常值检测 被引量:2
4
作者 尚华 冯牧 +1 位作者 张贝贝 于凤敏 《计算机应用研究》 CSCD 北大核心 2015年第12期3586-3589,共4页
针对Bayesian Lasso方法的变量选择和异常值检测进行了研究。该方法是在线性回归模型中引入识别变量,借助于双层Bayesian模型和Gibbs抽样算法,给出识别变量后验概率的计算方法和变量选择的方法,通过比较这些识别变量的后验概率进行异常... 针对Bayesian Lasso方法的变量选择和异常值检测进行了研究。该方法是在线性回归模型中引入识别变量,借助于双层Bayesian模型和Gibbs抽样算法,给出识别变量后验概率的计算方法和变量选择的方法,通过比较这些识别变量的后验概率进行异常值定位。最后进行了大量的模拟实验,结果表明,该方法是可行且有效的。 展开更多
关键词 变量选择 异常值 BAYESIAN lasso方法 GIBBS抽样
下载PDF
基于LASSO-LARS的软件复杂性度量属性特征选择研究 被引量:5
5
作者 周雁舟 乔辉 +2 位作者 吴晓萍 邵楠 惠文涛 《计算机科学》 CSCD 北大核心 2013年第11期169-173,共5页
针对软件可靠性早期预测中软件复杂性度量属性维数灾难问题,提出了一种基于最小绝对值压缩与选择方法(The Least Absolute Shrinkage and Select Operator,LASSO)和最小角回归(Least Angle Regression,LARS)算法的软件复杂性度量属性特... 针对软件可靠性早期预测中软件复杂性度量属性维数灾难问题,提出了一种基于最小绝对值压缩与选择方法(The Least Absolute Shrinkage and Select Operator,LASSO)和最小角回归(Least Angle Regression,LARS)算法的软件复杂性度量属性特征选择方法。该方法筛选掉一些对早期预测结果影响较小的软件复杂性度量属性,得到与早期预测关系最为密切的关键属性子集。首先分析了LASSO回归方法的特点及其在特征选择中的应用,然后对LARS算法进行了修正,使其可以解决LASSO方法所涉及的问题,得到相关的复杂性度量属性子集。最后结合学习向量量化(Learning Vector Quantization,LVQ)神经网络进行软件可靠性早期预测,并基于十折交叉方法进行实验。通过与传统特征选择方法相比较,证明所提方法可以显著提高软件可靠性早期预测精度。 展开更多
关键词 软件可靠性早期预测 特征选择 lasso回归方法 LARS算法 LVQ神经网络
下载PDF
基于LASSO-WOA-LSSVM的海洋管线外腐蚀速率预测 被引量:13
6
作者 骆正山 秦越 +1 位作者 张新生 毕傲睿 《表面技术》 EI CAS CSCD 北大核心 2021年第5期245-252,共8页
目的构建海洋管线外腐蚀速率预测模型,提高海底油气管线外腐蚀速率预测的准确性。方法建立基于套索(LASSO)回归和鲸鱼优化算法(WOA)的最小二乘支持向量机(LSSVM)腐蚀速率预测模型,采用LASSO回归方法对指标进行筛选,提取海洋管线腐蚀的... 目的构建海洋管线外腐蚀速率预测模型,提高海底油气管线外腐蚀速率预测的准确性。方法建立基于套索(LASSO)回归和鲸鱼优化算法(WOA)的最小二乘支持向量机(LSSVM)腐蚀速率预测模型,采用LASSO回归方法对指标进行筛选,提取海洋管线腐蚀的主要影响因素。应用最小二乘支持向量机算法建立海洋管线外腐蚀速率预测模型,并使用鲸鱼优化算法对模型参数进行优化,避免了参数取值对模型回归性能的影响。以海洋挂片实验为例,通过MATLAB进行模拟仿真,分析验证模型预测结果,并将预测结果与其他模型进行对比分析。结果 LASSO回归算法筛选得到影响腐蚀速率的主要因素为:温度、溶解氧含量、pH值。采用WOA-LSSVM模型所预测的结果与实际值较为吻合,其平均相对误差为2.23%,均方根误差(RMSE)为0.3248,决定系数R2达到0.9708,均优于其他两种模型。结论基于LASSO回归和鲸鱼优化算法的最小二乘支持向量机预测模型具有更优的泛化能力和预测精度,为海底管道腐蚀研究工作提供了新思路,也为海洋油气输送系统的结构安全与风险防范提供了参考。 展开更多
关键词 海洋管线 外腐蚀速率预测模型 lasso回归方法 鲸鱼优化算法(WOA) 最小二乘支持向量机(LSSVM)
下载PDF
Lasso问题的最新算法研究 被引量:10
7
作者 刘柳 陶大程 《数据采集与处理》 CSCD 北大核心 2015年第1期35-46,共12页
随着大规模数据的增加,解决Lasso问题成为一个新的热点,以往的方法很难满足大数据背景下的时间和效率问题。为了解决大规模数据及高维数据而带来的计算和储存的困难,本文从三个方面分析最新的算法,即一阶方法、随机方法及并行和分布计... 随着大规模数据的增加,解决Lasso问题成为一个新的热点,以往的方法很难满足大数据背景下的时间和效率问题。为了解决大规模数据及高维数据而带来的计算和储存的困难,本文从三个方面分析最新的算法,即一阶方法、随机方法及并行和分布计算。本文介绍和分析了解决最小收缩和选择算子(Least absolute shrinkage and selection operator,Lasso)问题的最新算法:梯度下降方法、交替方向乘子法(Alternating direction method of multipliers,ADMM)和坐标下降方法。其中梯度下降结合一阶方法和Nesterov的加速和光滑技术;交替方向乘子方法将随机方法融入在最新的算法中;坐标下降方法利用其坐标系的特点结合一阶方法、随机方法和并行和分布计算,本文分别从原始目标函数和对偶目标函数的角度对算法进行分析和研究。 展开更多
关键词 lasso问题 一阶方法 随机方法 交替方向乘子法 坐标下降
下载PDF
基于Group-Lasso方法的非均衡数据信用评分模型 被引量:2
8
作者 韦勇凤 向一波 《中国科学院大学学报(中英文)》 CSCD 北大核心 2021年第2期181-188,共8页
目前商业银行面临的个人信用风险问题极其复杂,如何对个人信用风险进行管理非常重要。个人信用风险建模是其中很关键的一步。利用某商业银行信用卡数据,构建信用评分模型,预测客户的违约概率。通过采用ROSE(random over sampling exampl... 目前商业银行面临的个人信用风险问题极其复杂,如何对个人信用风险进行管理非常重要。个人信用风险建模是其中很关键的一步。利用某商业银行信用卡数据,构建信用评分模型,预测客户的违约概率。通过采用ROSE(random over sampling examples)方法处理类别不均衡的问题,利用Group-Lasso(AUC准则)方法进行变量选择,构建基于Logistic回归的信用评分模型。实证结果表明,该方法对样本数据进行类别不均衡处理的结果比其他模型在判别能力和预测能力上更为有效。采用该方法所构建的模型能够作为客户信用评价决策的有效依据,指导银行及其他金融机构评估顾客个人信用风险,在实际运用中具有良好的可操作性。 展开更多
关键词 信用评分 Logistic回归 Group-lasso方法 ROSE
下载PDF
在线自适应LASSO罚向量自回归模型的风电功率预测 被引量:9
9
作者 王金甲 彭汝佳 《燕山大学学报》 CAS 北大核心 2018年第6期532-538,551,共8页
针对许多领域中普遍存在的非平稳多元时间序列的建模处理问题,提出了LASSO向量自回归模型的递推在线拟合方法,利用遗忘指数来实现模型的动态变化,并用循环坐标下降算法在线的对向量自回归模型进行系数估计。为证明模型的有效性,将其应... 针对许多领域中普遍存在的非平稳多元时间序列的建模处理问题,提出了LASSO向量自回归模型的递推在线拟合方法,利用遗忘指数来实现模型的动态变化,并用循环坐标下降算法在线的对向量自回归模型进行系数估计。为证明模型的有效性,将其应用于风电场风电功率的预测,并以传统的向量自回归模型和分层向量自回归模型作为比较基准。根据实验结果表明,在线自适应LASSO向量自回归模型的预测精度高于传统的批量模型,通过系数矩阵图也可以看出,预测风电场临近的风电场对预测点存在一定程度的影响,但自身影响是最大的。将递归在线估计与LASSO向量自回归模型的结合应用于风电功率的预测,对于提高风电功率的预测精度以及改善风电系统工作效率有重要意义。 展开更多
关键词 多元时间序列 风电功率预测 向量自回归模型 遗忘指数 坐标下降法 套索
下载PDF
Lasso法在我国农业用水效率模型的应用研究
10
作者 卞锦宇 耿雷华 +1 位作者 刘恒 杨晓华 《灌溉排水学报》 CSCD 北大核心 2015年第5期96-100,共5页
在收集全国31省(市、区)1997—2010年农业用水效率及其影响因素相关指标数据基础上,采用Lasso法分区建立以灌溉水利用系数为应变量、影响因子为自变量的农业用水效率分析模型,并筛选出各分区主要影响因子。结果表明,所建模型平均绝对误... 在收集全国31省(市、区)1997—2010年农业用水效率及其影响因素相关指标数据基础上,采用Lasso法分区建立以灌溉水利用系数为应变量、影响因子为自变量的农业用水效率分析模型,并筛选出各分区主要影响因子。结果表明,所建模型平均绝对误差都小于6%,表明所建模型精度较高。农民人均收入、人均水资源量、节水灌溉面积、人均耕地面积、降水量为影响农业用水效率的核心因子。 展开更多
关键词 农业用水效率 分析模型 影响因子 lasso
下载PDF
Factors Affecting Internet Banking Adoption: An Application of Adaptive LASSO
11
作者 Hatice Jenkins Siamand Hesami Fulden Yesiltepe 《Computers, Materials & Continua》 SCIE EI 2022年第9期6167-6184,共18页
This research investigates a broad range of possible factors affecting the adoption of new technology in the banking industry using adaptive LASSO and a standard logit model.The research integrated the adoption of the... This research investigates a broad range of possible factors affecting the adoption of new technology in the banking industry using adaptive LASSO and a standard logit model.The research integrated the adoption of the innovation framework and the technology acceptance theory to develop a conceptual framework for the analysis.Primary data was collected from 400 bank customers in North Cyprus.Risk perception and other customerspecific factors such as perceived risk index and negative attitude toward new technologies index were formulated for the proposed conceptual model.The findings indicated that individuals with a negative attitude toward new technology are least likely to adopt internet banking.In addition,the logit model suggested that age,education level,and general(innate)innovativeness significantly impact the adoption of internet banking.However,gender,income,occupation,perceived risk,familiarity with the internet,and social inclusion have no significant impact on internet banking adoption in North Cyprus. 展开更多
关键词 E-BANKING business technology internet banking adoption adaptive lasso method
下载PDF
稀疏组lasso罚向量自回归模型的大气污染物预测:京津冀案例研究 被引量:2
12
作者 王金甲 孙梦然 郝智 《高技术通讯》 北大核心 2017年第6期567-576,共10页
进行了大气污染物预测研究。针对传统的向量自回归模型方法所面临的过参数化问题,提出了稀疏组lasso罚向量自回归模型并应用近邻梯度下降法求解模型参数。为了验证模型的有效性,将其应用于2015年京津冀大气污染物数据中并对2016年1月1... 进行了大气污染物预测研究。针对传统的向量自回归模型方法所面临的过参数化问题,提出了稀疏组lasso罚向量自回归模型并应用近邻梯度下降法求解模型参数。为了验证模型的有效性,将其应用于2015年京津冀大气污染物数据中并对2016年1月1日北京6项大气污染物浓度进行预测。实验数据表明:基于稀疏组lasso罚模型的PM2.5预测归一化均方误差约为3.8%,预测精度高于向量自回归(VAR)模型、基于各种稀疏结构的向量自回归(VAR-L)模型、分层向量自回归(HVAR)模型。此外,京津冀不同城市对北京的空气质量影响程度不同,这可以通过组内稀疏模型参数进行解释。将凸优化概念与向量自回归模型结合应用于大气污染物浓度的预测中,对京津冀大气污染协同治理具有重要意义。 展开更多
关键词 向量自回归(VAR)模型 稀疏组lasso 近邻梯度下降法 凸优化 大气污染
下载PDF
基于自适用lasso的更新几何过程参数估计
13
作者 梁小林 李静 郭敏 《经济数学》 2017年第2期43-46,共4页
根据更新几何过程的定义和性质,运用lasso类方法构建模型获取其参数估计,并通过数值模拟进行检验,验证了该方法是有效的.在具有不同更新几何过程比率的条件下,比较了lasso和自适用lasso两种方法的估计,结果表明自适用lasso方法更适合更... 根据更新几何过程的定义和性质,运用lasso类方法构建模型获取其参数估计,并通过数值模拟进行检验,验证了该方法是有效的.在具有不同更新几何过程比率的条件下,比较了lasso和自适用lasso两种方法的估计,结果表明自适用lasso方法更适合更新几何过程的参数估计. 展开更多
关键词 数理统计 参数估计 lasso类方法 更新几何过程
下载PDF
Group Lasso正则化问题的邻近梯度算法的线性收敛性
14
作者 晁绵涛 邓钊 唐春明 《广西大学学报(自然科学版)》 CAS 北大核心 2016年第6期2071-2077,共7页
研究一类目标函数是光滑凸函数与Group Lasso正则项和的优化问题。利用不动点迭代理论分析了邻近梯度算法的全局收敛性和有限收敛性。特别地,在不要求光滑凸函数为严格凸函数的条件下建立了邻近梯度法的线性收敛性。
关键词 邻近梯度算法 线性收敛性 GROUP lasso
下载PDF
基于稀疏组LASSO约束的本征音子说话人自适应
15
作者 屈丹 张文林 《通信学报》 EI CSCD 北大核心 2015年第9期47-54,共8页
本征音子说话人自适应方法在自适应数据量不足时会出现严重的过拟合现象,提出了一种基于稀疏组LASSO约束的本征音子说话人自适应算法。首先给出隐马尔可夫—高斯混合模型下本征音子说话人自适应的基本原理;然后将稀疏组LASSO正则化引入... 本征音子说话人自适应方法在自适应数据量不足时会出现严重的过拟合现象,提出了一种基于稀疏组LASSO约束的本征音子说话人自适应算法。首先给出隐马尔可夫—高斯混合模型下本征音子说话人自适应的基本原理;然后将稀疏组LASSO正则化引入到本征音子说话人自适应,通过调整权重因子控制模型的复杂度,并通过一种加速近点梯度的数学优化算法来实现;最后将稀疏组LASSO约束的自适应算法与当前多种正则化约束的自适应方法进行比较。汉语连续语音识别的说话人自适应实验表明,引入稀疏组LASSO约束后,本征音子说话人自适应方法的性能得到了明显提高,且稀疏组LASSO约束方法优于l1、l2和弹性网正则化方法。 展开更多
关键词 说话人自适应 本征音子 组稀疏约束 稀疏组lasso约束 近点梯度法
下载PDF
中国碳排放影响因素分析——基于面板数据STIRPAT-Alasso模型实证研究 被引量:18
16
作者 陈邦丽 徐美萍 《生态经济》 北大核心 2018年第1期20-24,48,共6页
依据环境经济学理论,运用扩展STIRPAT模型,采用中国2005--2011年29个省份的数据,从人口、财富程度、技术水平、对外开放程度、金融发展水平、创新能力6个维度遴选尽可能多的社会经济变量,探究影响中国碳排放的主要因素。在变换原始... 依据环境经济学理论,运用扩展STIRPAT模型,采用中国2005--2011年29个省份的数据,从人口、财富程度、技术水平、对外开放程度、金融发展水平、创新能力6个维度遴选尽可能多的社会经济变量,探究影响中国碳排放的主要因素。在变换原始数据去除个体异质性后,利用自适应套索方法进行显著变量选取和系数估计,得到一个较岭和偏最小二乘回归更简约有效的模型。结果表明:人均GDP、城市化水平、第二产业比重对碳排放有显著驱动作用,而外商直接投资、创新水平对碳排放产生抑制作用;在样本期内碳排放与人均GDP之间呈单调递增形态,不支持倒“u”型环境库兹涅茨曲线假说;碳排放与金融发展之间呈倒“u”型曲线关系。最后根据研究结果提出了一些政策建议,以期为政府减排提供决策依据和参考。 展开更多
关键词 碳排放 影响因素 STIRPAT扩展模型 自适应套索方法
下载PDF
丝绸之路经济带核心区新型城镇化驱动因素量化分析与对策——基于LASSO的变量筛选 被引量:8
17
作者 刘晶 何伦志 《干旱区地理》 CSCD 北大核心 2019年第6期1478-1485,共8页
在"一带一路"与新型城镇化两大体系融合的背景下,新疆作为丝绸之路经济带核心区,其城镇化的健康发展不仅关系着新疆社会稳定、长治久安与经济的可持续发展,同时对"一带一路"建设起到支撑作用。影响新型城镇化发展... 在"一带一路"与新型城镇化两大体系融合的背景下,新疆作为丝绸之路经济带核心区,其城镇化的健康发展不仅关系着新疆社会稳定、长治久安与经济的可持续发展,同时对"一带一路"建设起到支撑作用。影响新型城镇化发展的因素众多,采用LASSO方法从可能影响新疆新型城镇化发展的经济贸易、基础设施、社会保障、政府制度、教育科技、医疗卫生、金融发展、人民生活、人口就业、民族文化、资源环境、能源消耗以及兵团建设13个方面选取64个驱动因子进行量化分析,依据模型压缩系数实现指标精简。对各因素的影响效果进行分析,从基础设施建设、兵地融合、参与"一带一路"建设、对口援疆以及水资源利用方面给出推进丝绸之路经济带核心区新型城镇化发展的对策与建议。 展开更多
关键词 新型城镇化 驱动因素 lasso筛选 对策 丝绸之路经济带核心区
下载PDF
基于Lasso类方法在时间序列变量选择中的应用 被引量:2
18
作者 杨丽娟 马云艳 《鲁东大学学报(自然科学版)》 2016年第1期14-18,97,98,共7页
在时间序列场合下对Lasso方法与Adaptive Lasso方法进行比较,数值模拟结果表明Adaptive Lasso方法比Lasso方法更加有效.通过对沪深300指数的技术指标的历史数据进行变量选择,比较发现二者均可以有效并准确地选择出合适变量,且Adaptive L... 在时间序列场合下对Lasso方法与Adaptive Lasso方法进行比较,数值模拟结果表明Adaptive Lasso方法比Lasso方法更加有效.通过对沪深300指数的技术指标的历史数据进行变量选择,比较发现二者均可以有效并准确地选择出合适变量,且Adaptive Lasso方法的参数估计相对更加精确.最后,根据选出变量及其参数进行预测,结果表明Adaptive Lasso方法变量选择和参数估计效果良好. 展开更多
关键词 lasso方法 变量选择 时间序列
下载PDF
基于LASSO法的桉木-相思混合制浆原料近红外分析模型的建立 被引量:1
19
作者 吴珽 梁龙 +2 位作者 朱北平 邓拥军 房桂干 《林产化学与工业》 EI CAS CSCD 北大核心 2020年第5期83-90,共8页
为提高国内木浆产量和利用率,缓解制浆造纸行业优质原料紧缺的现状,针对我国南方特定的制浆原料模式——桉木-相思混合原料进行快速分析研究。采集了175个桉木-相思混合原料和45个单一材种原料的近红外光谱,明确其混合程度和化学成分含... 为提高国内木浆产量和利用率,缓解制浆造纸行业优质原料紧缺的现状,针对我国南方特定的制浆原料模式——桉木-相思混合原料进行快速分析研究。采集了175个桉木-相思混合原料和45个单一材种原料的近红外光谱,明确其混合程度和化学成分含量。通过平滑、矢量归一化(V-Norm)、多元散射校正(MSC)、一阶导数(1st Der)和二阶导数(2nd Der)等方法组合预处理原始光谱,结合LASSO算法,确定了混合程度(桉木质量分数)、综纤维素、Klason木质素、聚戊糖、苯醇抽出物和1%NaOH抽出物含量分析模型的建模方法,并建立了相应的模型。建模过程中最优调整参数(μ)分别为13.62、18.30、6.39、9.64、7.49和12.07。6个模型的预测均方根误差(RMSEP)值分别为1.93%、0.61%、0.51%、0.80%、0.28%和0.41%。绝对偏差范围(AD)分别为-3.19%~3.24%、-0.96%~1.01%、-0.89%~0.84%、-1.37%~1.46%、-0.43%~0.39%和-0.58%~0.60%。模型适应性好,能够满足制浆造纸工业需求,同时也证实了LASSO法用于混合制浆原料分析的可行性。 展开更多
关键词 近红外光谱 制浆造纸 lasso算法 预处理 桉木-相思
下载PDF
近红外光谱LASSO特征选择方法及其聚类分析应用研究 被引量:13
20
作者 李鱼强 潘天红 +1 位作者 李浩然 邹小波 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第12期3809-3815,共7页
近红外光谱技术是一种通过分析样本的特征光谱数据,实现定性或定量分析的无损检测方法,特征数据的完整性和代表性决定了所建模型的性能,而现有分析方法只能实现光谱子区间特征筛选,导致分析模型稳定性差、且难以再优化。为实现近红外光... 近红外光谱技术是一种通过分析样本的特征光谱数据,实现定性或定量分析的无损检测方法,特征数据的完整性和代表性决定了所建模型的性能,而现有分析方法只能实现光谱子区间特征筛选,导致分析模型稳定性差、且难以再优化。为实现近红外光谱区间高维数特征提取,有效提高近红外光谱定性分析模型的精度和稳定性,提出一种基于最小绝对收缩和选择算法(LASSO)的光谱特征筛选方法,并以我国特色高值外贸产品云南松茸为分析对象进行聚类应用研究,讨论了该方法对于高维光谱特征筛选的有效性、分析对比了LASSO筛选特征变量及主元分析(PCA)降维算法所建松茸真伪甄别及食用菌分类模型的预测精度及稳定性。通过调研发现,云南产鲜松茸因其独特外形易于分辨,而片状的干松茸失去其独有的外形特征,导致国内干松茸掺假事件屡禁不止。选取云南产松茸、杏鲍菇、老人头、姬松茸四种干样共166样本数据进行分析,采用光谱范围为900~1700 nm的NIRQuest512型近红外光谱仪获得166×512维原始光谱数据,剔除异常数据后采用标准正态变换对光谱数据进行预处理。在此基础上,利用LASSO筛选出全光谱区间的特征变量,再使用Kennard-Stone法并结合典型线性(KNN)和非线性建模(BP)算法,构建松茸真伪甄别模型和食用菌分类模型,对两种模型进行盲样测试,并分析了LASSO与PCA算法的不同点,最后使用蒙特卡罗方法检测两种模型的稳定性。实验结果表明基于LASSO光谱特征选择的松茸真伪甄别模型和食用菌分类模型预测精度和稳定性均高于PCA方法,其中基于原始光谱数据所建真伪甄别模型的预测准确率为69.57%(BP)和60.87%(KNN),食用菌分类模型准确率为67.39%(BP)和65.22%(KNN),基于LASSO特征筛选的真伪甄别模型预测准确率分别达到100%(BP)和78.26%(KNN),食用菌分类模型预测准确率分别达到89.13%(BP)和80.43%(KNN),对两种模型进行10次蒙特卡罗实验,其结果平均值分别为99.93%和97.22%,由此可知,与PCA等数据降维算法相比,LASSO可实现全光谱区间的光谱特征选择和数据降维,有效地提高了近红外定性分析模型的预测性能,为近红外分析提供了一种新的特征筛选方法。 展开更多
关键词 近红外光谱 特征选择 lasso 松茸鉴别 蒙特卡罗方法
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部