期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于Adaptive Lasso及RF算法的冰雪天气交通事故分析 被引量:21
1
作者 赵玮 徐良杰 +2 位作者 冉斌 汪济洲 张璇 《中国安全科学学报》 CAS CSCD 北大核心 2017年第2期98-103,共6页
为分析冰雪天气下高速公路交通事故频发致因,量化分析驾驶环境、驾驶员及车辆情况对事故的影响,根据Adaptive Lasso和随机森林(RF)混合算法建立预测模型。以10年约30万组冰雪环境下高速公路交通事故数据为例,训练改进预测模型验证其准... 为分析冰雪天气下高速公路交通事故频发致因,量化分析驾驶环境、驾驶员及车辆情况对事故的影响,根据Adaptive Lasso和随机森林(RF)混合算法建立预测模型。以10年约30万组冰雪环境下高速公路交通事故数据为例,训练改进预测模型验证其准确性。结果表明,混合算法的准确度和拟合程度都优于支持向量机(SVM)、分类回归树(CART)及RF等单独算法。交通事故与环境因素相关性最显著,坡路、弯道及交叉口处事故受冰雪环境影响较大;事故与驾驶员因素中部分因素显著相关,如驾驶员性别及安全带使用情况;本地驾驶员对驾驶能力及冰雪环境的估计错误更易导致交通事故。 展开更多
关键词 高速公路 交通事故 ADAPTIVE lasso 随机森林(RF) 冰雪天气 大数据分析
下载PDF
Lasso问题的最新算法研究 被引量:10
2
作者 刘柳 陶大程 《数据采集与处理》 CSCD 北大核心 2015年第1期35-46,共12页
随着大规模数据的增加,解决Lasso问题成为一个新的热点,以往的方法很难满足大数据背景下的时间和效率问题。为了解决大规模数据及高维数据而带来的计算和储存的困难,本文从三个方面分析最新的算法,即一阶方法、随机方法及并行和分布计... 随着大规模数据的增加,解决Lasso问题成为一个新的热点,以往的方法很难满足大数据背景下的时间和效率问题。为了解决大规模数据及高维数据而带来的计算和储存的困难,本文从三个方面分析最新的算法,即一阶方法、随机方法及并行和分布计算。本文介绍和分析了解决最小收缩和选择算子(Least absolute shrinkage and selection operator,Lasso)问题的最新算法:梯度下降方法、交替方向乘子法(Alternating direction method of multipliers,ADMM)和坐标下降方法。其中梯度下降结合一阶方法和Nesterov的加速和光滑技术;交替方向乘子方法将随机方法融入在最新的算法中;坐标下降方法利用其坐标系的特点结合一阶方法、随机方法和并行和分布计算,本文分别从原始目标函数和对偶目标函数的角度对算法进行分析和研究。 展开更多
关键词 lasso问题 一阶方法 随机方法 交替方向乘子法 坐标下降
下载PDF
甘肃省猪肉价格预测与风险预警研究
3
作者 周玉兰 李爱爱 王官娟 《农业展望》 2024年第4期11-18,共8页
对猪肉价格进行预测、预警,可以有效指导生猪养殖,保障猪肉供需平衡。为促进甘肃省猪肉市场稳定可持续发展,本研究以猪肉价格为研究对象,运用Lasso算法筛选变量,利用哈里斯鹰优化算法(HHO)对随机森林(RF)进行改进,建立预测模型HHO-RF,... 对猪肉价格进行预测、预警,可以有效指导生猪养殖,保障猪肉供需平衡。为促进甘肃省猪肉市场稳定可持续发展,本研究以猪肉价格为研究对象,运用Lasso算法筛选变量,利用哈里斯鹰优化算法(HHO)对随机森林(RF)进行改进,建立预测模型HHO-RF,对猪肉价格进行预测、预警。结果表明:HHO-RF模型均方误差(MSE)为0.22,可决系数(R^(2))为99.76%,相对分析误差(PRD)为20.6,具有较好的拟合效果;对猪肉价格的风险预警效果较好,准确率达到91.67%,说明模型HHO-RF可以较为准确地预测甘肃省猪肉价格走势。对2022年11月至2025年10月甘肃省猪肉价格预测发现,预测期内价格整体呈现先降后升最后稳定的趋势。基于此,推动甘肃省猪肉产业健康发展,建议优化猪肉价格预测系统,提高价格预测精度;拓宽猪肉价格信息公布通道,促进信息共享;建立健全猪肉价格风险预警体系,提高应急调控水平。 展开更多
关键词 猪肉价格 走势预测 lasso回归 随机森林 哈里斯鹰优化算法 风险预警机制
下载PDF
椎间盘退变伴氧化应激关键生物标志物:生物信息学和机器学习算法的识别
4
作者 兰垚 陈浏阳 宋文慧 《中国组织工程研究》 CAS 北大核心 2024年第35期5591-5597,共7页
背景:氧化应激与椎间盘退变的发生发展息息相关,但其发病机制和有效治疗方法仍不明确。目的:运用生物信息学及3种机器学习算法识别与椎间盘退变伴氧化应激相关的关键基因及免疫浸润分析,并进行实验验证。方法:从GEO数据库获得椎间盘退... 背景:氧化应激与椎间盘退变的发生发展息息相关,但其发病机制和有效治疗方法仍不明确。目的:运用生物信息学及3种机器学习算法识别与椎间盘退变伴氧化应激相关的关键基因及免疫浸润分析,并进行实验验证。方法:从GEO数据库获得椎间盘退变基因表达谱以及从GeneCards数据库获得氧化应激相关基因,对椎间盘退变数据集进行差异分析及加权基因共表达网络(WGCNA)分析,两者取交集并与氧化应激相关基因取交集得到候选hub基因,对候选hub基因进行GO和KEGG分析;运用机器学习(LASSO回归、SVM-RFE及随机森林)筛选最佳特征基因并进行受试者特征曲线验证,同时行相关免疫浸润分析。收集2023年7-11月就诊于山西医科大学第二医院的颈椎病患者的椎间盘样本作为椎间盘退变组,颈椎脊髓损伤患者的椎间盘样本作为对照组,采用qPCR方法验证特征基因在椎间盘退变组织中的相对表达量。结果与结论:(1)经过差异基因分析获取424个差异表达基因,WGCNA分析得到5087个基因,同时获得氧化应激基因1399个,进而得到23个候选hub基因;(2)GO分析结果显示,主要参与细菌防御反应、细菌来源分子反应等生物过程;涉及分泌颗粒腔、细胞质囊泡腔等细胞组成;涉及内肽酶活性和硫化合物结合等分子功能;(3)KEGG分析结果显示,候选hub基因与中性粒细胞胞外诱捕网形成、肾素-血管紧张素系统通路等信号通路有关;(4)运用3种机器学习和ROC验证后得到关键基因HSPA6和PKD1;(5)免疫浸润分析显示HSPA6与活化树突状细胞(r=0.88,P<0.001)、活化CD4^(+)T细胞(r=-0.72,P<0.01)等密切相关,同时PKD1与效应型记忆CD8^(+)T细胞(r=0.55,P<0.05)、活化树突状细胞(r=-0.56,P<0.05)等密切相关;(6)q PCR实验结果表明椎间盘退变组中HSPA6基因低于对照组(P<0.0001),而PKD1基因高于对照组(P<0.0001);(7)结果表明运用生物信息学及机器学习算法证实HSPA6和PKD1可作为椎间盘退变伴氧化应激的生物标志物,可能通过干预HSPA6和PKD1来改善椎间盘退变。 展开更多
关键词 椎间盘退变 氧化应激 差异分析 WGCNA分析 lasso回归 SVM-RFE分析 随机森林 特征基因 生物信息学 免疫浸润分析
下载PDF
基于Lasso-logistic回归和随机森林模型的院校评价结果影响因素研究
5
作者 何双 赵国瑞 崔庆岳 《长春师范大学学报》 2022年第2期11-16,共6页
将Lasso-logistic模型引入院校评价结果影响因素的厘定研究,以教育部高职“双高”院校为研究个案,相较于支持向量机、决策树等模型,Lasso-logistic能够更高效地压缩筛选出入选“双高”院校的关键解释变量,而且总体预测准确率近80%,模型... 将Lasso-logistic模型引入院校评价结果影响因素的厘定研究,以教育部高职“双高”院校为研究个案,相较于支持向量机、决策树等模型,Lasso-logistic能够更高效地压缩筛选出入选“双高”院校的关键解释变量,而且总体预测准确率近80%,模型外推性良好,通过随机森林模型进一步验证了Lasso-logistic结果的合理性.实证结果表明,专业、教师、学生标志性成果是核心影响因素,建校时间、教师数、生师比等因素未产生实质性影响. 展开更多
关键词 院校评价结果 影响因素 厘定 lasso-logistic 随机森林
下载PDF
基于随机化适应性Lasso的高维变量选择 被引量:3
6
作者 闫懋博 田茂再 《统计研究》 CSSCI 北大核心 2021年第1期147-160,共14页
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性La... Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。 展开更多
关键词 随机化适应性lasso 高维变量选择 选择性推断
下载PDF
Lasso方法在我国高校教材特征价格研究中的应用
7
作者 许丹丹 王力宾 《玉溪师范学院学报》 2011年第12期39-45,共7页
2001年,美国劳工部发布了高校教材质量调整方法即特征价格方法,笔者在此基础上搜集了我国2008~2010年的873本高校教材的图书信息,尝试使用Lasso方法解决逐步回归删除变量过多的问题.实证研究表明:该方法较逐步回归保留了更多变量,且模... 2001年,美国劳工部发布了高校教材质量调整方法即特征价格方法,笔者在此基础上搜集了我国2008~2010年的873本高校教材的图书信息,尝试使用Lasso方法解决逐步回归删除变量过多的问题.实证研究表明:该方法较逐步回归保留了更多变量,且模型可解释的优点恰恰适合于构建特征价格模型,因此较适宜于我国高校教材特征价格指数的编制.从研究结果看,经过质量调整后的我国高校教材价格在过去的两年里平均上涨了0.25%. 展开更多
关键词 质量调整 特征价格 lasso 随机森林
下载PDF
改进随机蛙跳算法在大豆品种快速鉴别中的应用
8
作者 李伟 谭峰 +2 位作者 张伟 高陆思 李金山 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第12期3763-3769,共7页
大豆品种快速准确的鉴别,对于鉴定种子品质、净化种业市场以及保障粮食安全具有重要意义。为解决传统农作物品种鉴别方法中存在精度差和效率低等问题,采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型,对黑龙江省4个高蛋... 大豆品种快速准确的鉴别,对于鉴定种子品质、净化种业市场以及保障粮食安全具有重要意义。为解决传统农作物品种鉴别方法中存在精度差和效率低等问题,采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型,对黑龙江省4个高蛋白大豆品种(黑农88、黑农98、绥农71以及绥农76)进行快速鉴别。随机蛙跳(RF)算法是一种通过迭代计算变量被选概率,以确定变量重要性的新型特征波长选择算法,可以有效剔除全光谱数据中的冗余信息。该方法存在初始变量集随机性、所需迭代次数大、阈值选取不确定的问题,因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0,消除初始变量的随机性,在此基础上开始迭代计算,可以减少无用迭代次数,提高模型的预测精确度。RF算法通过设定阈值的方法选择变量,因此提取的特征波长往往具有不确定性。改进如下:首先去除被选概率为0的变量,对于排序后变量以10个波长点为间隔,每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型,当交叉验证均方根误差(RMSECV)取最小值时的建模波长为优选特征波长。以MRF优选特征波长作为输入变量建立PLS鉴别模型,并与全光谱以及常用的RF、LASSO和ElasticNet特征波长选择算法建模结果进行对比分析。结果表明,MRF算法提取300个特征波长点,仅占全谱波长的9.37%,有效筛选了关键特征变量,简化了模型复杂度。预测结果中均方根误差(RMSEP)和决定系数(Rp2)分别为0.246 9和0.951 2,识别准确率达到100%,为所有模型中最优。拉曼光谱结合MRF算法可以实现大豆品种的快速鉴别,同时也为其他农作物品种的快速鉴别提供了一种新思路。 展开更多
关键词 拉曼光谱 大豆 特征波长选择 随机蛙跳 最小绝对收敛与选择算子
下载PDF
基于K-means聚类的城市轨道站点周边共享单车需求预测方法研究 被引量:2
9
作者 胡雅群 哈米提 许子凯 《交通工程》 2023年第5期82-90,98,共10页
针对共享单车作为公共交通的重要组成能形成轨道交通+共享单车的出行方式,提高城市公共交通的运行效率,但也引发了共享单车运营不合理的问题.论文采用K-means算法,划分5类轨道交通站点,其中共享单车借还量作为聚类变量,提出了1组通过量... 针对共享单车作为公共交通的重要组成能形成轨道交通+共享单车的出行方式,提高城市公共交通的运行效率,但也引发了共享单车运营不合理的问题.论文采用K-means算法,划分5类轨道交通站点,其中共享单车借还量作为聚类变量,提出了1组通过量化指标进行特征分析的聚类方式.对不同轨道站点接驳共享单车需求预测,利用随机森林和套索回归算法,并对比不同模型的预测准确度.结果表明,类型4站点下,使用套索回归模型效果更好,其他4类站点均为随机森林模型表现优于套索回归模型.本研究可为轨道站点及其附近停车设施的规划与建设提供参考. 展开更多
关键词 交通工程 城市轨道交通 K-MEANS算法 共享单车需求预测方法 随机森林算法 套索算法
下载PDF
基于随机森林算法的福建省降雨预测
10
作者 朱宏宇 刘群 《黑龙江科学》 2023年第14期49-52,共4页
以福建省2021年6月—2022年5月的云层气象数据为研究对象,按经纬度网格将福建省划分为5个区域,通过随机森林分类算法依次对5个区域是否降雨进行分类模型训练。结果显示,各区域预测准确率均达到96%以上,但不同区域的特征重要性程度不一,... 以福建省2021年6月—2022年5月的云层气象数据为研究对象,按经纬度网格将福建省划分为5个区域,通过随机森林分类算法依次对5个区域是否降雨进行分类模型训练。结果显示,各区域预测准确率均达到96%以上,但不同区域的特征重要性程度不一,其中中云位总云量、低云位总云量、地表植物冠层地表水3个特征对各个区域是否降雨的影响较重要。 展开更多
关键词 lasso回归 随机森林 特征选择 降雨预测
下载PDF
基于机器学习方法的辽宁省初霜冻日期预测模型研究 被引量:1
11
作者 王涛 王乙舒 +5 位作者 赵春雨 王小桃 秦美欧 沈玉敏 侯依玲 赵建云 《气象与环境学报》 2022年第4期47-56,共10页
基于前期ERA5逐月再分析数据,应用3种机器学习算法(Lasso回归、随机森林和神经网络)对辽宁省初霜冻日期进行预测评估。Lasso回归算法提取对初霜冻日期预测有重要指示意义的气象要素特征集,通过交叉验证和超参数调优建立初霜冻日期预测模... 基于前期ERA5逐月再分析数据,应用3种机器学习算法(Lasso回归、随机森林和神经网络)对辽宁省初霜冻日期进行预测评估。Lasso回归算法提取对初霜冻日期预测有重要指示意义的气象要素特征集,通过交叉验证和超参数调优建立初霜冻日期预测模型,利用均方根误差(RMSE)和距平同号率方法定量定性地评估模型的预测效果。结果表明:特征选择后的气象要素特征集建模提升了模型的泛化能力、可解释性和稳定性;Lasso回归模型在4月起报的预测效果最好(RMSE为6—8 d),神经网络模型在5月起报性能最好(RMSE为6—9 d),随机森林模型在3月起报性能最好(RMSE为8—9 d);辽宁全省大部分站点距平同号率为50%—70%,其中Lasso回归和神经网络模型为5月起报最高(约为68%),随机森林算法为3月起报最高(约为62%)。特征选择和敏感性实验结果发现,低植被覆盖比例是初霜冻日期预测关键预测因子,植被覆盖率越高越有利于地表含水量保持,降温容易产生霜冻,初霜冻日期也就越易提前,去掉低植被覆盖比例因子后模型预测效果显著下降,也表明该因子是模型建模的前期关键因子。 展开更多
关键词 ERA5 机器学习 lasso回归 随机森林 神经网络
下载PDF
基于随机森林模型和LASSO回归的高血压住院患者医疗费用及其影响因素分析
12
作者 谭艳粒 张峥嵘 +4 位作者 谢红宁 韦咏 邓旭 陆雅 庞翠军 《医学综述》 CAS 2024年第19期2321-2326,2331,共7页
目的基于随机森林模型和LASSO回归探究高血压住院患者医疗费用及其影响因素。方法选取2018年10月至2022年4月广西医科大学第二附属医院出院的1087例高血压患者为研究对象,从医院信息系统收集患者基本特征和住院信息等资料。采用随机森... 目的基于随机森林模型和LASSO回归探究高血压住院患者医疗费用及其影响因素。方法选取2018年10月至2022年4月广西医科大学第二附属医院出院的1087例高血压患者为研究对象,从医院信息系统收集患者基本特征和住院信息等资料。采用随机森林模型和LASSO回归筛选具有统计学意义的变量纳入多重线性回归,分析医疗费用的影响因素,并进行敏感性分析。结果高血压住院患者医疗费用为6916(5069,10183)元。已婚患者的医疗费用高于其他婚姻状况患者[7075(5247,10276)元比5963(4406,9214)元](P<0.01),其他住院科室患者医疗费用高于心血管内科患者[7565(5345,12478)元比6728(4837,9280)元](P<0.01),转科室患者医疗费用高于未转科室患者[13854(8654,30625)元比6840(5004,9905)元](P<0.01),有主诊断伴随并发症患者医疗费用高于无主诊断伴随并发症患者[12545(8408,29940)元比6823(4989,9494)元](P<0.01),不同年龄、医保类型、住院时间患者的医疗费用比较差异有统计学意义(P<0.01)。当LASSO回归lambda值为1se时,筛选出4个影响因素,经随机森林对自变量重要性评分排序,前4位自变量分别为住院时间、年龄、是否有主诊断伴随并发症、是否转科室。多重线性回归分析显示,住院时间、年龄、是否有主诊断伴随并发症、是否转科室是高血压患者医疗费用的主要影响因素(P<0.01)。敏感性分析结果显示,住院时间增加、年龄增大、有主诊断伴随并发症、转科室治疗与较高医疗费用有关(P<0.05),与原多重线性回归模型结果趋势一致。结论控制高血压患者人群的疾病经济负担时,可考虑从缩短住院时间、增强身体素质以降低患病风险、延缓并发症发生等方面采取相应的措施。 展开更多
关键词 高血压 医疗费用 影响因素 随机森林 lasso回归
下载PDF
基于随机森林的自适应特征选择算法 被引量:8
13
作者 刘凯 郑山红 +1 位作者 蒋权 赵天傲 《计算机技术与发展》 2018年第9期101-104,111,共5页
为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本... 为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本间关联程度后自助采样,并设计出一种特征对类代表强弱程度的计算方法;然后引入自适应稀疏约束机制Group LASSO优化特征的选择;最后在Spark分布式计算平台利用UCI数据集进行实验,结果表明,相比传统的RF算法,SARFFS算法在特征子集选择上具有更好的性能,在F1上提升将近9%。从最终排名靠前的重要特征分析,该算法能够考虑特征间相关性,对预测结果确实有影响,并有效地提高了随机属性权值的可靠性和稳定性。 展开更多
关键词 随机森林 自适应 特征选择 Grouplasso方法
下载PDF
基于随机搜索优化XGBoost的瓦斯涌出量预测模型 被引量:11
14
作者 马恒 任美学 高科 《中国安全生产科学技术》 CAS CSCD 北大核心 2022年第5期129-134,共6页
为防治瓦斯灾害,解决井下瓦斯涌出量在预测过程中因影响因素繁多带来的精度较低问题,提出1种基于套索(Lasso)回归与随机搜索优化极限梯度提升(XGBoost)的模型进行瓦斯涌出量预测。以沈阳某煤矿综采面瓦斯涌出量历史数据为例,综合考虑影... 为防治瓦斯灾害,解决井下瓦斯涌出量在预测过程中因影响因素繁多带来的精度较低问题,提出1种基于套索(Lasso)回归与随机搜索优化极限梯度提升(XGBoost)的模型进行瓦斯涌出量预测。以沈阳某煤矿综采面瓦斯涌出量历史数据为例,综合考虑影响瓦斯涌出量的影响因素。首先利用Lasso回归提取对瓦斯涌出量有重要影响的特征数据,作为预测输入;采用随机搜索算法对XGBoost模型4种主要参数进行寻优,选取最优参建立预测模型获得预测指标并分析比较其他模型。研究结果表明:Lasso回归筛选出的影响因素结合随机搜索获得的最优参数组合优化XGBoost比其他模型预测精度更高,平均相对误差为1.53%,均方根误差为0.1403 m^(3)/min,希尔不等系数为0.0132,研究结果可为现场瓦斯管理提供参考依据。 展开更多
关键词 随机搜索算法 XGBoost模型 瓦斯涌出量 lasso回归
下载PDF
航班运行控制风险评估精度提升方法 被引量:1
15
作者 谢春生 杨志远 +1 位作者 刘锟 王岩韬 《安全与环境学报》 CAS CSCD 北大核心 2022年第3期1227-1234,共8页
为了解决航班风险评估精度不足的问题,对某航空公司225个航班运行数据进行统计和分析,运用Lasso和随机森林算法、粗糙集分析和支持向量机、主成分分析与RBF神经网络结合3类算法,使用相同训练集和测试集构建风险评价模型。结果表明:随机... 为了解决航班风险评估精度不足的问题,对某航空公司225个航班运行数据进行统计和分析,运用Lasso和随机森林算法、粗糙集分析和支持向量机、主成分分析与RBF神经网络结合3类算法,使用相同训练集和测试集构建风险评价模型。结果表明:随机森林算法分类精度为88%;主成分分析与支持向量机算法合用分类精度由64%提升至86%;非线性主成分分析与RBF神经网络算法合用精度由52%提升至80%。综合3类算法的精度适用范围,构建混合模型,其最终分类结果精度可高达94%;并且,经过K折稳定性检验验证了方案的可用性和可靠性。 展开更多
关键词 安全工程 航班运控风险 风险评估 lasso与RF 支持向量机 RBF神经网络
下载PDF
基于LRF方法的在线短租房源价格特征选择研究 被引量:1
16
作者 张浩 朱晨龙 《软件导刊》 2020年第8期1-5,共5页
为解决单一特征选择方法的局限性问题,提出Lasso-RF(LRF)混合特征选择方法,并应用于在线短租房源价格问题研究。基于Airbnb房源数据,实验首先通过Lasso回归进行特征选择,处理特征之间的多重共线性;然后采用随机森林算法精选剩余特征,最... 为解决单一特征选择方法的局限性问题,提出Lasso-RF(LRF)混合特征选择方法,并应用于在线短租房源价格问题研究。基于Airbnb房源数据,实验首先通过Lasso回归进行特征选择,处理特征之间的多重共线性;然后采用随机森林算法精选剩余特征,最终得到35个重要特征,并带入4个预测模型中进行比较。结果表明,特征之间的多重共线性会影响随机森林算法对特征重要度的度量;LRF-RF预测模型与RF-RF预测模型相比,评价指标R2和MSE分别提高了0.005、0.006,同时运行时间缩短0.267秒,表明LRF混合特征选择方法优于单一的RF特征选择方法。 展开更多
关键词 特征选择 lasso 随机森林 在线短租 房源价格
下载PDF
海洋经济发展驱动因素筛选模型创新研究——基于我国11个沿海省市面板数据
17
作者 邵桂兰 刘冰 李晨 《中国渔业经济》 2018年第5期91-99,共9页
随着我国海洋产业结构转换升级步伐加快,海洋经济担当起我国经济发展蓝色引擎的重任,海洋经济发展的主驱动力辨析成为推动海洋经济发展的重点问题。基于2006-2014年我国主要沿海省市的面板数据,从原始数据中提炼出8个驱动要素,再利用la... 随着我国海洋产业结构转换升级步伐加快,海洋经济担当起我国经济发展蓝色引擎的重任,海洋经济发展的主驱动力辨析成为推动海洋经济发展的重点问题。基于2006-2014年我国主要沿海省市的面板数据,从原始数据中提炼出8个驱动要素,再利用lasso、随机森林和最优子集选择法筛选并提取我国海洋经济发展的主要驱动因素,进一步对重要程度较高的因素科技、区域经济和海洋生态着重分析,提出适用性较为广泛的海洋经济发展驱动因素筛选模型。研究发现,科技、区域经济和海洋生态对海洋经济发展影响最大,它们各自为政又相得益彰,科技和区域经济发展程度越高,越能够将海洋生态的作用发挥到最大化。大力推动海洋科技进步,重视海洋生态在海洋经济发展中的中坚地位,是实现海洋经济可持续发展的必然途径。 展开更多
关键词 海洋经济 驱动因素 lasso 随机森林 最优子集选择法
下载PDF
需求驱动的云平台产品关键设计特征识别方法 被引量:4
18
作者 苏兆婧 余隋怀 +3 位作者 初建杰 于明玖 宫静 黄悦欣 《计算机集成制造系统》 EI CSCD 北大核心 2021年第12期3604-3613,共10页
为完善云服务平台产品设计知识发现系统,同时进一步提升需求与服务的匹配效率,提出一种基于转换器的双向编码表征(BERT)和随机Lasso的产品关键设计特征识别方法。首先,实验采用真实产品用户反馈数据集并对其进行人工标注,以BERT预训练... 为完善云服务平台产品设计知识发现系统,同时进一步提升需求与服务的匹配效率,提出一种基于转换器的双向编码表征(BERT)和随机Lasso的产品关键设计特征识别方法。首先,实验采用真实产品用户反馈数据集并对其进行人工标注,以BERT预训练语言模型为基础,建立输出层以训练设计领域命名实体识别模型,实现对显性设计特征的自动识别。实验表明,所提方法可以实现较好的性能,精确率、召回率、F1分数分别为90.55%、97.16%和93.68%。同时,提出一种知识迁移思想,在当前大数据环境下,利用随机Lasso算法挖掘其中蕴含的关键设计特征并加以重用,实现了对隐性设计特征的精确定位。 展开更多
关键词 工业设计 用户需求 基于转换器的双向编码表征 命名实体识别 随机lasso 产品设计
下载PDF
基于组约束深度神经网络的航运监控事件识别 被引量:2
19
作者 明道睿 张鸿 《计算机工程与设计》 北大核心 2020年第10期2949-2957,共9页
针对传统的机器学习算法以及常规的深度学习模型对于大数据量的航运监控视频识别效果不佳的问题,设计一种组约束深度神经网络模型(GCDNN)对实时航运监控视频进行识别。模型主要由结合Inception结构的VGG-16组件和优化LSTM单元的深层双... 针对传统的机器学习算法以及常规的深度学习模型对于大数据量的航运监控视频识别效果不佳的问题,设计一种组约束深度神经网络模型(GCDNN)对实时航运监控视频进行识别。模型主要由结合Inception结构的VGG-16组件和优化LSTM单元的深层双向循环神经网络DBO-LSTM组件构成,充分提取视频帧序列的时空特征,使用稀疏组套索正则化算法进行网络稀疏处理,使用随机森林算法输出分类结果。实验结果表明,所提模型可以较好提升大数据量下的视频识别准确率,对于受恶劣天气影响的数据具有较强的识别能力,验证了所提模型的有效性。 展开更多
关键词 航运监控 视频识别 神经网络 稀疏组套索 随机森林
下载PDF
基于联想神经网络的轴承剩余使用寿命预测 被引量:4
20
作者 郑凯 李少波 《机械设计与制造》 北大核心 2020年第11期203-206,共4页
为了提高现代制造业的可靠性和效率,根据轴承剩余使用寿命预测(RUL),提出了一种基于联想神经网络的轴承剩余寿命预测模型。该模型在17个轴承数据集上随机选出4个轴承的数据作为模型的验证集,剩下的13个轴承数据来训练集,并采用5折交叉... 为了提高现代制造业的可靠性和效率,根据轴承剩余使用寿命预测(RUL),提出了一种基于联想神经网络的轴承剩余寿命预测模型。该模型在17个轴承数据集上随机选出4个轴承的数据作为模型的验证集,剩下的13个轴承数据来训练集,并采用5折交叉验证将这13个轴承数据划分为训练集和测试集。在训练神经网络时,采用了学习率衰减机制,并对比学习率衰减机制与固定学习率的差异。试验结果表明,该模型相比LASSO、随机森林回归(RFR)、支持向量回归(SVR)、深度学习等方法在RMSE和MAE两个方面具有明显的提高。 展开更多
关键词 联想神经网络 RUL lasso 随机森林回归 支持向量回归 深度学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部