期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于随机森林的亚健康状态预测与特征选择方法研究 被引量:8
1
作者 王小强 《计算机应用与软件》 CSCD 北大核心 2014年第1期296-298,307,共4页
亚健康状态是一种介于健康和疾病之间的低质量状态。研究的目的是要确定哪些因素或因素组合能够针对亚健康状态进行预测。临床流行病学调查,获取572个实际案例(其中,523宗均为亚健康状态,49宗为健康),在报告中包括了50种相关症状。应用... 亚健康状态是一种介于健康和疾病之间的低质量状态。研究的目的是要确定哪些因素或因素组合能够针对亚健康状态进行预测。临床流行病学调查,获取572个实际案例(其中,523宗均为亚健康状态,49宗为健康),在报告中包括了50种相关症状。应用随机森林分类技术进行基于临床数据分析的亚健康状态预测,正确分类率为91.28%。由50倍随机森林方法所得到的特征选择(症状),即疲劳、心悸、四肢肌无力、疲劳程度和悲观态度是重要的判别变量。相关实验结果显示了提出方法的可行性与高效性。 展开更多
关键词 亚健康状态 随机森林特征选择 状态预测 数学模型
下载PDF
一种结合改进CHI和RFFS的特征选择算法研究 被引量:1
2
作者 邱宁佳 周稳 +1 位作者 王鹏 陶跃 《计算机工程与应用》 CSCD 北大核心 2018年第21期133-140,共8页
针对传统CHI算法忽略特征词的词频易导致重要特征词被漏选的问题,结合特征选择时Filter类算法速度快、Wrapper类算法准确率高的特点,提出一种将改进CHI(TDF-CHI)算法与随机森林特征选择(RFFS)相结合的特征选择算法。先利用TDF-CHI算法... 针对传统CHI算法忽略特征词的词频易导致重要特征词被漏选的问题,结合特征选择时Filter类算法速度快、Wrapper类算法准确率高的特点,提出一种将改进CHI(TDF-CHI)算法与随机森林特征选择(RFFS)相结合的特征选择算法。先利用TDF-CHI算法计算特征词的文档频率及词频与类别的相关程度来进行特征选择,去除冗余特征;再通过RFFS算法度量剩余特征的重要性,进行二次特征选择,优化特征集合,使分类器的性能进一步提升。为了验证改进算法的优越性,利用新闻文本数据,在常用的分类器上进行测试。实验表明,改进算法相比传统CHI算法所选特征词具有更好的分类效果,提高了分类器的准确率和召回率。 展开更多
关键词 特征选择 TDF-CHI 随机森林特征选择(RFFS) 文本分类
下载PDF
基于改进随机森林分类器在RGBD面部表情上的应用研究
3
作者 张御宇 倪蓉蓉 杨彪 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期82-89,共8页
面部表情识别是机器感知人类情绪变化的重要途径.利用面部RGB图像可以进行表情识别,但是容易受到光照变化影响,而且较难刻画细微表情变化.对采用RGBD面部图像识别6种基本面部表情(高兴、悲伤、愤怒、沮丧、恐惧以及惊讶)进行研究.首先... 面部表情识别是机器感知人类情绪变化的重要途径.利用面部RGB图像可以进行表情识别,但是容易受到光照变化影响,而且较难刻画细微表情变化.对采用RGBD面部图像识别6种基本面部表情(高兴、悲伤、愤怒、沮丧、恐惧以及惊讶)进行研究.首先利用深度图像鲁棒地检测面部;然后在面部灰度图像中检测并跟踪二维面部标记点,并添加对应的深度信息构造深度面部几何特征,从而有效识别细微表情变化;最后利用基于特征选择的随机森林分类器对不同面部表情进行识别.基准数据库上的对比实验结果表明本文算法的表情识别准确率高于主流基于手动提取特征的面部表情识别方法,接近基于卷积神经网络的识别算法性能. 展开更多
关键词 面部检测 面部表情识别 RGBD面部图像 特征选择随机森林 面部几何特征
下载PDF
基于Stacking集成学习的近红外光谱油页岩含油率预测 被引量:3
4
作者 李泉伦 陈争光 焦峰 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第4期1030-1036,共7页
为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同... 为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同时扫描每个样本对应的近红外光谱数据。样本使用蒙特卡洛算法进行异常样本剔除,将剔除异常样本后的213个数据按照3∶1的比例随机划分为训练集和预测集。利用去趋势加基线校正方法进行预处理消除光谱数据中噪声和基线漂移,利用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法进行特征波长提取,进一步降低数据维度。最后,构建以PLS,SVM,RF和GBDT为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型,各初级学习器模型参数使用网格搜索进行寻优。使用决定系数和预测均方根误差作为各模型的评价指标,探究单一模型和集成学习模型对油页岩含油率预测的准确性。研究结果表明,RF-CARS方法能够有效筛选重要波长,进而提高模型效率。基于Stacking的异构集成学习模型与单一模型(SVM和PLS)和同构集成学习模型(RF和GBDT)相比有更好的预测效果和更强的稳定性。在多次随机划分数据集的基础上,Stacking集成学习模型的平均决定系数R2为0.8942,相比于其他单一模型平均提高了0.0623;RMSEP为0.5869,比其他模型平均降低了0.1474。说明,基于Stacking的异构集成学习模型能够组合初级学习器的优势,提高油页岩含油率预测精度,为油页岩含油率快速检测提供了一种新方法。 展开更多
关键词 近红外光谱 集成学习 油页岩含油率 特征波长 随机森林特征选择
下载PDF
基于高光谱成像技术的辣椒叶片叶绿素含量估算 被引量:8
5
作者 袁自然 叶寅 +3 位作者 武际 方凌 陈晓芳 杨欣 《江苏农业科学》 北大核心 2021年第16期189-193,共5页
叶绿素是植被光合作用的重要物质,能够间接反映植被的健康状况和光合能力。高光谱技术的发展为大面积、快速检测植被叶绿素含量变化提供了可能。选取150组不同生长期的辣椒叶片作为研究对象,分别采集辣椒叶片的高光谱图像和叶绿素含量... 叶绿素是植被光合作用的重要物质,能够间接反映植被的健康状况和光合能力。高光谱技术的发展为大面积、快速检测植被叶绿素含量变化提供了可能。选取150组不同生长期的辣椒叶片作为研究对象,分别采集辣椒叶片的高光谱图像和叶绿素含量。利用随机森林特征选择算法进行数据筛选,结合线性回归、偏最小二乘回归、梯度提升回归树、随机森林回归等4种模型分别构建回归模型。结果表明:(1)利用随机森林特征选择算法筛选后波段建立的模型决定系数(r^(2))均大于0.8,说明该方法具有较高的稳定性和预测精度;(2)利用随机森林特征选择算法筛选的波段结合随机森林回归,其验证集的r^(2)为0.9、均方根误差(RMSE)为1.87、平均绝对误差(MAE)为1.43。可以较为准确地预测辣椒叶片叶绿素含量,为后期利用高光谱成像技术大面积检测辣椒的生长状况提供了理论依据。 展开更多
关键词 高光谱成像 辣椒叶片 叶绿素含量 随机森林特征选择算法 回归模型
下载PDF
深圳市商品房住宅价格影响因素研究及预测 被引量:2
6
作者 党彤彤 王万雄 《工程经济》 2022年第12期62-70,共9页
本文从房地产供给端、需求端、以及宏观经济三个方面选取与深圳市房地产价格相关的因素,采用随机森林的特征选择原理进行变量筛选,建立相应的多维静态灰色预测模型GM(0,4)以及高斯过程回归GPR进行拟合并对比模型的优劣,对比结果说明:经... 本文从房地产供给端、需求端、以及宏观经济三个方面选取与深圳市房地产价格相关的因素,采用随机森林的特征选择原理进行变量筛选,建立相应的多维静态灰色预测模型GM(0,4)以及高斯过程回归GPR进行拟合并对比模型的优劣,对比结果说明:经过梯度下降法(GD)超参数优化的高斯过程回归在模型性能与数据拟合方面是最优的。最后利用灰色预测系统着重研究房住不炒政策提出后商品房住宅价格在2021-2025年可能的变化情况,预测结果表明:2016-2020年间商品房住宅价格依靠居民消费驱动现象明显,2021-2025年的平均房价可能呈现持续下降趋势。 展开更多
关键词 随机森林特征选择 灰色预测 高斯过程回归 梯度下降法
下载PDF
基于堆叠泛化集成模型的脱硝系统入口处氮氧化物浓度预测研究
7
作者 马立增 张玲 +2 位作者 谷宇 吴俣 唐媛媛 《电力科技与环保》 2022年第6期517-524,共8页
为提高燃煤电厂选择性催化还原法脱硝入口处氮氧化物浓度的预测准确度,考虑锅炉燃烧过程中非线性、工况复杂的特点,使用某电厂660 MW火电机组的分布式控制系统的历史运行数据进行模拟实验,提出了一种基于堆叠泛化集成模型的氮氧化物浓... 为提高燃煤电厂选择性催化还原法脱硝入口处氮氧化物浓度的预测准确度,考虑锅炉燃烧过程中非线性、工况复杂的特点,使用某电厂660 MW火电机组的分布式控制系统的历史运行数据进行模拟实验,提出了一种基于堆叠泛化集成模型的氮氧化物浓度预测方法。首先,采用随机森林特征选择算法选择出对脱硝入口处氮氧化物浓度有较大影响的辅助特征变量。然后,利用选定的特征变量构建多模型堆叠泛化集成氮氧化物预测模型。其中,以反向传播神经网络、支持向量回归和决策树为基础模型,线性回归为元模型。预测结果表明,与单模型相比,集成模型有更高的预测准确率(89.2%)和决定系数R2(91%),且通过十折交叉验证也表明集成模型的均方根误差均低于三种单一模型的均方根误差,具有较强的鲁棒性和泛化能力。所提出的算法和模型适用于预测脱硝入口处氮氧化物浓度预测。 展开更多
关键词 脱硝入口处氮氧化物浓度 堆叠泛化集成 随机森林特征选择
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部