期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于地理加权随机森林的长三角PM_(2.5)建模
1
作者 陈艺敏 苏漳文 +1 位作者 陈移萍 林子彭 《中国环境科学》 EI CAS CSCD 北大核心 2024年第8期4240-4248,共9页
采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标... 采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标均优于RF模型,且GWRF模型残差的空间自相关性更低.(2)GWRF模型预测2019年PM_(2.5)浓度分布优于RF模型,与实际观测浓度分布基本一致,但两个模型均存在北部高估南部低估的情况,且高估区域大于低估区域.(3)RF模型在研究PM_(2.5)浓度分布最重要且显著的驱动因子方面是全局性的,而GWRF模型得到干旱、气温、温差、风速以及人类干扰对PM_(2.5)分布的影响是局部性的.在大尺度下,这种局部性的效应对于PM_(2.5)精细化防控更具实际性的指导意义.此外,在全球气候暖干化和区域气候空间异质性的背景下,把干旱融入PM_(2.5)预测并建立具有局部效应的模型有助于环境监管机构及决策者制定防控措施. 展开更多
关键词 PM_(2.5)驱动因素 地理加权随机森林 空间效应 长三角地区
下载PDF
基于地理加权随机森林的黑龙江省森林碳储量遥感估测
2
作者 卫格冉 李明泽 +3 位作者 全迎 王斌 刘建阳 明烺 《中南林业科技大学学报》 CAS CSCD 北大核心 2024年第7期64-76,共13页
【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导... 【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导意义。【方法】以黑龙江省小兴安岭、长白山地区森林植被碳储量为研究对象,基于2015年森林资源连续清查数据和Landsat8-OLI影像,采用普通最小二乘(Ordinary least squares,OLS)、随机森林(Random forest,RF)模型、地理加权回归(Geographically weighted regression,GWR)模型以及地理加权随机森林模型分别构建不同林型及总体(不分林型)的森林碳储量估测模型,比较是否区分林分类型时,不同模型预测精度之间的差异,实现对研究区森林碳储量的精准反演。【结果】1)各个模型在区分林型时的预测精度均高于总体(不分林型)情况,以GWRF模型精度最优,其中针叶林精度最高(R^(2)=0.58,RMSE=15.97 t/hm^(2));阔叶林次之(R^(2)=0.46,RMSE=17.66 t/hm^(2));针阔混交林随后(R^(2)=0.45,RMSE=19.51 t/hm^(2));总体(不分林型)最低(R^(2)=0.40,RMSE=20.22 t/hm^(2))。2)4种模型的检验精度GWRF>RF>GWR>OLS。与OLS相比,GWRF在针叶林、阔叶林、针阔混交林和总体(不分林型)中提升的ΔR^(2)分别为0.15、0.09、0.16和0.04;降低的ΔRMSE分别为2.09、1.35、3.47和0.89 t/hm^(2);与RF相比,GWRF提升的ΔR^(2)分别为针叶林0.14、阔叶林0.06、针阔混交林0.04、总体(不分林型)0.02;降低的ΔRMSE分别为针叶林1.95 t/hm^(2)、阔叶林0.86 t/hm^(2)、针阔混交林0.67 t/hm^(2)、总体(不分林型)0.29 t/hm^(2)。3)研究区森林碳储量密度最高预测值为77.08 t/hm^(2),最低值为5.24 t/hm^(2),平均值为41.07 t/hm^(2),总量为552.04 Tg;从空间上看,森林碳储量高值分布在小兴安岭东南部、张广财岭等地区,呈现斑状不均匀性分布。【结论】相比于其他3种模型,GWRF作为局部模型,考虑到空间异质性,在区域尺度范围内估测森林碳储量有较好的应用前景。区分林分类型能提高预测精度,在今后对森林生物量或碳储量的研究中,应考虑区分林分类型建模。本研究的模型和方法有一定适应性,可为森林资源的快速和精准监测提供方法借鉴。 展开更多
关键词 森林碳储量 地理加权随机森林 地理加权回归 随机森林 遥感估测
下载PDF
基于加权随机森林的Web数据库检索结果智能分类方法
3
作者 马秀梅 《现代计算机》 2024年第16期25-29,共5页
Web数据库检索结果具有数据复杂、数量庞大的特点,数据间的复杂关系处于一种模糊状态,导致隶属度区别较小,分类过程需要多次迭代,效率较低。因此,提出了基于加权随机森林的Web数据库检索结果智能分类方法。提取Web数据库检索结果数据特... Web数据库检索结果具有数据复杂、数量庞大的特点,数据间的复杂关系处于一种模糊状态,导致隶属度区别较小,分类过程需要多次迭代,效率较低。因此,提出了基于加权随机森林的Web数据库检索结果智能分类方法。提取Web数据库检索结果数据特征,并对Web数据库检索结果进行冗余处理。经过冗余处理之后,采用加权随机森林技术确定Web数据库检索结果模糊隶属度的范围。最后通过计算样本的分类权值,设计Web数据库检索结果分类器,实现Web数据库检索结果智能分类。实验结果表明:该方法的F1值均在95%以上,最长分类时间仅为7.8 s,表明本文方法能够更快速、精确地完成分类任务。 展开更多
关键词 加权随机森林 WEB数据库 模糊隶属度 智能分类方法
下载PDF
融合加权随机森林的自动3D椎骨CT图像主动轮廓分割方法 被引量:4
4
作者 刘侠 甘权 +2 位作者 李冰 刘晓 王波 《光电工程》 CAS CSCD 北大核心 2020年第12期35-46,共12页
为了解决CT图像主动轮廓分割方法对初始轮廓的敏感和分割不准确的问题,本文提出一种融合加权随机森林的自动3D椎骨CT主动轮廓分割方法WRF-AC。该方法提出加权随机森林算法和包含边缘能量的主动轮廓能量函数。首先,通过提取椎骨CT的3D Ha... 为了解决CT图像主动轮廓分割方法对初始轮廓的敏感和分割不准确的问题,本文提出一种融合加权随机森林的自动3D椎骨CT主动轮廓分割方法WRF-AC。该方法提出加权随机森林算法和包含边缘能量的主动轮廓能量函数。首先,通过提取椎骨CT的3D Haar-like特征值训练加权随机森林获得的椎骨中心作为分割的初始轮廓,然后,求解包含边缘能量的主动轮廓能量函数最小值完成椎骨CT图像的分割。实验结果表明,本方法在相同数据集上能够更加准确、快速地分割脊柱CT图像提取椎骨部分。 展开更多
关键词 3D分割 CT图像 加权随机森林 主动轮廓
下载PDF
基于加权随机森林的番茄氮元素缺乏分级模型研究 被引量:2
5
作者 李莉 蓝天 +1 位作者 赵奇慧 孟繁佳 《农业机械学报》 EI CAS CSCD 北大核心 2021年第11期219-225,262,共8页
基于叶面颜色特征建立番茄氮元素缺乏分级模型判别准确率可达0.8以上。夏季定植的番茄叶片表面会覆盖粘质腺毛,粘质腺毛利于番茄吸收水分和营养元素,相同营养液氮离子浓度下叶片黄化过程异于未覆盖粘质腺毛的叶片。故仅基于叶面颜色特... 基于叶面颜色特征建立番茄氮元素缺乏分级模型判别准确率可达0.8以上。夏季定植的番茄叶片表面会覆盖粘质腺毛,粘质腺毛利于番茄吸收水分和营养元素,相同营养液氮离子浓度下叶片黄化过程异于未覆盖粘质腺毛的叶片。故仅基于叶面颜色特征建立分级模型,其准确率降至0.65。覆盖粘质腺毛番茄其叶片周长和叶面积两个形状特征均小于未覆盖粘质腺毛的番茄叶片,本文将番茄叶片两个形状特征结合原有叶面颜色特征共同作为模型输入,建立新的番茄氮元素缺乏分级模型。搭建图像采集系统,该图像采集单元由树莓派和其相机模块构建,使用WiFi或4G网络完成智能手机、图像采集单元、本地计算机之间无线数据传输。智能手机通过Web界面可远程控制采集图像并将图像传输到云平台存储。本地计算机对图像进行预处理提取叶片形状、颜色特征后输入模型进行预测,并输出预测结果。试验结果表明,图像采集系统春季和夏季平均温度在19.7~28.3℃范围内,光照在1125~9543 lx范围内均可正常使用,采集的图像经预处理分割后降低了环境光线的影响。使用优化后的加权随机森林模型,基于形状特征和颜色特征相结合的叶片氮元素缺乏分级判别准确率可达0.83。 展开更多
关键词 番茄 氮元素 形状特征 颜色特征 判别分级 加权随机森林
下载PDF
考虑不确定性的TBM施工速度加权随机森林预测模型 被引量:1
6
作者 闫长斌 高子昂 +4 位作者 姚西桐 汪鹤健 杨风威 杨继华 卢高明 《岩土工程学报》 EI CAS CSCD 北大核心 2023年第12期2575-2583,共9页
TBM施工速度影响因素众多,具有显著的不确定性。对于地质参数的模糊性,采用岩体分级系统RMR、岩石耐磨性CAI和岩石硬度H衡量地质条件;对于施工过程中机械参数的随机性,利用TBM刀盘推力TF与转速RPM等主动控制参数进行分析;同时提出以其... TBM施工速度影响因素众多,具有显著的不确定性。对于地质参数的模糊性,采用岩体分级系统RMR、岩石耐磨性CAI和岩石硬度H衡量地质条件;对于施工过程中机械参数的随机性,利用TBM刀盘推力TF与转速RPM等主动控制参数进行分析;同时提出以其他因素停机时间占比来量化人为因素的不确定性。依托兰州水源地建设工程输水隧洞双护盾TBM施工实测数据,建立了考虑不确定性的TBM施工速度预测数据库和加权随机森林算法模型,并与随机森林、支持向量回归、BP神经网络等预测方法进行了对比分析。研究表明,加权随机森林模型中测试集的预测结果均方根误差和决定系数分别为1.59,0.97,预测精度及可靠性均优于其他3种模型。该模型采用不同权重赋值的方法优化超参数,具有高精度、不易过拟合等优点,表现出更好的泛化能力和鲁棒性。 展开更多
关键词 隧道掘进机(TBM) 施工速度 不确定性 加权随机森林 支持向量回归 神经网络 预测模型
下载PDF
基于加权随机森林的FDD-LTE上行干扰分类研究
7
作者 许鸿奎 李鑫 +2 位作者 邵星 姜彤彤 宫淑兰 《山东建筑大学学报》 2020年第6期23-29,共7页
研究和应用加权随机森林算法可以有效地解决频分双工—长期演进(FDD-LTE)网络中上行干扰数据存在不平衡的问题,是提高上行干扰分类准确率的有效方法。文章针对测量报告(MR)数据中的上行平均干扰电平,建立了一种基于加权随机森林的上行... 研究和应用加权随机森林算法可以有效地解决频分双工—长期演进(FDD-LTE)网络中上行干扰数据存在不平衡的问题,是提高上行干扰分类准确率的有效方法。文章针对测量报告(MR)数据中的上行平均干扰电平,建立了一种基于加权随机森林的上行干扰分类模型,并设置了类权重参数,对比分析了决策树、随机森林和加权随机森林等3种算法的分类效果。结果表明:加权随机森林能够提升不平衡数据中数量较少类的分类正确率,其互调干扰和阻塞干扰的分类正确率分别达到73.91%和96.67%;在不平衡的FDD-LTE上行干扰分类中,加权随机森林能够取得优于决策树和传统随机森林的结果,其分类正确率达到96.22%,而运行时间仅有0.98 s。 展开更多
关键词 FDD-LTE 上行干扰 不平衡数据 加权随机森林
下载PDF
基于地理加权随机森林的青藏地区放牧强度时空格局模拟 被引量:3
8
作者 李兰晖 黄聪聪 +5 位作者 张镱锂 刘林山 王兆锋 张海燕 丁明军 张华敏 《地理科学》 CSSCI CSCD 北大核心 2023年第3期398-410,共13页
精确刻画放牧强度时空格局是深刻理解青藏地区高寒草地服务功能动态及其驱动机制的重要基础,对辅助制定区域生态安全和可持续发展战略具有意义。基于牲畜年末存栏量、牧区人口密度、生长季NDVI、年降水量、年平均气温和居民点分布等数据... 精确刻画放牧强度时空格局是深刻理解青藏地区高寒草地服务功能动态及其驱动机制的重要基础,对辅助制定区域生态安全和可持续发展战略具有意义。基于牲畜年末存栏量、牧区人口密度、生长季NDVI、年降水量、年平均气温和居民点分布等数据,采用地理加权随机森林模型,模拟了2000年、2010年和2020年3期青藏地区放牧强度的空间格局,并定量评价了环境因子对放牧强度空间分布解释性的区域差异。结果表明:(1)地理加权随机森林模拟结果可精细地刻画青藏地区放牧强度的空间特征,与经典随机森林模型相比,判定系数更高,平均绝对值误差和均方根误差更低。(2)青藏地区放牧强度呈现东南高、西北低的基本特征,其中,西北部地区放牧强度低于25羊单位/km~2的区域约占青藏地区面积的1/2。(3)与2000年和2010年相比,2020年青藏地区放牧强度呈现总体下降、局部抬升的态势;其中,较2010年,2020年放牧强度下降超过1羊单位/km~2的区域占牧区面积的61.69%。(4)牧区人口密度是解释放牧强度空间异质性最主要的因素,其相对重要性呈现西高东低的特征,而降水量和生长季NDVI的相对重要性则呈现西北高、东南低的特征。研究结论可为青藏地区草地可持续管理和生态安全屏障建设提供科学参考。 展开更多
关键词 放牧强度 地理加权随机森林 牧区人口密度 青藏地区
下载PDF
加权随机森林和代价敏感支持向量机与心衰患者死亡风险评估 被引量:4
9
作者 杨弘 田晶 +6 位作者 孟冰霞 张瑜 罗艳虹 王可 郑楚 韩清华 张岩波 《中国卫生统计》 CSCD 北大核心 2022年第3期381-384,388,共5页
目的 探讨加权随机森林和代价敏感支持向量机模型在慢性心衰死亡风险评估中的应用。方法 利用AUC-RF自变量筛选方法选出与心衰死亡的相关因素,将选出的变量作为输入变量,预后有无死亡作为结局变量构建传统随机森林、支持向量机、logisti... 目的 探讨加权随机森林和代价敏感支持向量机模型在慢性心衰死亡风险评估中的应用。方法 利用AUC-RF自变量筛选方法选出与心衰死亡的相关因素,将选出的变量作为输入变量,预后有无死亡作为结局变量构建传统随机森林、支持向量机、logistic回归、加权随机森林和代价敏感支持向量机分类预测模型。结果 AUC-RF筛选出的变量中有中枢系统疾病史、肾功能不全史、心包积液、BMI、中性粒细胞比值、肾小球滤过率、N端前脑钠肽等指标重要度较高,提示这些指标或有临床意义。评价指标有灵敏度、特异度、准确度、G-means、F-measure和AUC值,logistic模型评价指标的中位数分别为:78.46%、63.19%、81.4%、0.6933、0.467和0.7003;加权随机森林评价指标分别为:78.08%、82.74%、85.96%、0.8086、0.4853和0.8109;代价敏感支持向量机评价指标分别为:75.38%、72.49%、88.8%、0.7402、0.4749和0.7940。结论 加权随机森林模型对心衰患者预后死亡预测性能较高,该模型有助于临床医生识别心衰死亡危险因素,具有较高应用价值。 展开更多
关键词 慢性心衰 疾病预后 加权随机森林 代价敏感支持向量机
下载PDF
基于加权随机森林的三阴性乳腺癌microRNA组学数据的分类预测 被引量:1
10
作者 郭志飞 王碧珏 +4 位作者 杨海涛 李治 王菊平 曹红艳 周立业 《中国卫生统计》 CSCD 北大核心 2020年第6期809-812,817,共5页
目的基于microRNA组学数据,探讨加权随机森林在三阴性乳腺癌分类预测中的应用,为疾病诊断提供方法学支撑。方法以TCGA乳腺癌数据为例,采用加权随机森林构建三阴性乳腺癌的分类预测模型,并与随机森林、logistic回归、支持向量机、LASSO... 目的基于microRNA组学数据,探讨加权随机森林在三阴性乳腺癌分类预测中的应用,为疾病诊断提供方法学支撑。方法以TCGA乳腺癌数据为例,采用加权随机森林构建三阴性乳腺癌的分类预测模型,并与随机森林、logistic回归、支持向量机、LASSO和岭回归五种模型进行比较。结果通过比较六种模型的5个评价指标,加权随机森林模型的预测性能明显优于其他五种模型,加权随机森林模型的灵敏度为0.852、特异度为0.873、准确度为0.871、AUC值为0.862和G-means值为0.861。结论加权随机森林构建的分类预测模型较好地识别了三阴性乳腺癌患者,可为三阴性乳腺癌的诊断提供方法学上的参考。 展开更多
关键词 加权随机森林 分类预测 MICRORNA 三阴性乳腺癌
下载PDF
航空电弧故障的组合加权随机森林分类方法 被引量:2
11
作者 桑益芹 葛红娟 +2 位作者 李静 潘姝越 李煌 《航空计算技术》 2022年第2期77-81,共5页
针对现有电弧时频域分析适用范围存在局限性,以及电弧故障分类未考虑特征价值量的问题,提出以电弧能量为时域特征、以电弧电流为频域特征的组合加权随机森林电弧故障分类方法。通过离散分数阶傅里叶变换分析频域特征,以类散度作为评价... 针对现有电弧时频域分析适用范围存在局限性,以及电弧故障分类未考虑特征价值量的问题,提出以电弧能量为时域特征、以电弧电流为频域特征的组合加权随机森林电弧故障分类方法。通过离散分数阶傅里叶变换分析频域特征,以类散度作为评价指标得到时频域的特征价值量,结合由随机森林自检测功能得到的特征重要度,构建新的组合权重。在纯阻、阻感、阻容性条件下,以航空28 V、270 V直流串联和并联电弧为研究对象,比较所提方法和现有随机森林的故障分类效果。结果表明,采用的时域和频域特征能有效区分不同电压和负载条件下的电弧故障程度,提出的加权随机森林比现有随机森林的故障分类准确率提高了2.44%,诊断效果更好。 展开更多
关键词 航空电弧故障 故障分类 时频域特征 特征价值量 加权随机森林
下载PDF
基于加权随机森林算法的虚拟试衣型号推荐技术研究 被引量:1
12
作者 李涛 冯向阳 《智能计算机与应用》 2019年第4期116-124,共9页
随着体感交互技术的发展,基于Kinect的虚拟试衣系统为顾客在线选购衣物提供了一种新的选择方案.Kinect可以较为准确地测量出人体的骨骼模型,生成人体三维数据,以进一步为顾客推荐衣服型号,并利用可视化技术进行虚拟试装.然而,人的体型不... 随着体感交互技术的发展,基于Kinect的虚拟试衣系统为顾客在线选购衣物提供了一种新的选择方案.Kinect可以较为准确地测量出人体的骨骼模型,生成人体三维数据,以进一步为顾客推荐衣服型号,并利用可视化技术进行虚拟试装.然而,人的体型不同,不同厂家的制衣型号也不规范,传统的数据筛选与匹配手段为顾客选择的衣服尺码总是不尽人意.本项目基于Kinect获取的人体三维数据,设计了一种加权随机森林方法为顾客预测并推荐合适的衣服型号.结合其它机器学习模型,本文进行了对比实验,结果表明随机森林模型有效而准确,在3000个测试样本上得到了最高的准确率(100%).该模型泛化能力强,且足够健壮稳定,可以广泛地应用在虚拟试衣型号推荐情景中. 展开更多
关键词 虚拟试衣型号 KINECT 加权随机森林
下载PDF
基于加权随机森林算法的空巢电力用户识别方法 被引量:2
13
作者 卢子萌 陈佳怡 +4 位作者 李璟 谢岳 蒋欣利 韩蕾 郭倩 《电信科学》 2020年第8期112-121,共10页
针对当前政府和社会对空巢老人的识别缺乏有效技术手段的问题,提出了一种基于加权随机森林算法的空巢电力用户识别方法。首先通过调查问卷获取部分准确空巢用户标签,并从用电水平、用电波动、用电趋势3个方面构建用户用电特征库,由于空... 针对当前政府和社会对空巢老人的识别缺乏有效技术手段的问题,提出了一种基于加权随机森林算法的空巢电力用户识别方法。首先通过调查问卷获取部分准确空巢用户标签,并从用电水平、用电波动、用电趋势3个方面构建用户用电特征库,由于空巢与非空巢存在用户数据不平衡问题,采用加权随机森林算法改善机器学习对数据敏感的现象,将该算法模型在电力公司采集系统部署上线,并对2000户未知类型用户进行空巢识别,其空巢识别准确率达到74.2%。结果表明,从用电角度研究对空巢老人的识别,可以帮助电网公司了解空巢老人的个性化、差异化需求,从而为用户提供更精细的服务,也可以协助政府和社会开展帮扶工作。 展开更多
关键词 空巢用户识别 加权随机森林算法 用户用电特征库 数据不平衡
下载PDF
基于校友数据的大学生就业影响因素加权随机森林模型 被引量:1
14
作者 王小龙 穆芸菲 +4 位作者 朱玥祺 寇子若 谢佳美 李涓涓 郭晓明 《电脑知识与技术》 2023年第1期81-84,87,共5页
为了更好地分析利用校友经济新形势下的就业数据,建立了影响大学生就业因素的加权随机森林模型。首先对影响就业的因素进行排序,然后通过加权随机森林模型,准确预测在校生未来就业情况,在此基础上充分利用校友资源并搭建平台为学生就业... 为了更好地分析利用校友经济新形势下的就业数据,建立了影响大学生就业因素的加权随机森林模型。首先对影响就业的因素进行排序,然后通过加权随机森林模型,准确预测在校生未来就业情况,在此基础上充分利用校友资源并搭建平台为学生就业创造机遇,加强与校友之间的联系,有效推进大学生就业工作。以某大学部分校友数据为实例,得到构建的模型预测准确率为82.3%。 展开更多
关键词 校友资源 加权随机森林 算法实现 就业预测 小程序
下载PDF
基于PSO优化的叶节点加权随机森林算法 被引量:1
15
作者 胡明祺 张森昶 《现代计算机》 2022年第4期1-4,共4页
随机森林算法(random forest)是属于集成学习的一种组合分类方法,作为一种重要的机器学习算法,随机森林算法普遍适用于大部分数据集。通过使用PSO算法优化并采用对叶节点加权的方式,可以改善传统随机森林算法的性能,提升其分类能力。利... 随机森林算法(random forest)是属于集成学习的一种组合分类方法,作为一种重要的机器学习算法,随机森林算法普遍适用于大部分数据集。通过使用PSO算法优化并采用对叶节点加权的方式,可以改善传统随机森林算法的性能,提升其分类能力。利用PSO算法全局搜索能力强、收敛速度快的优势,根据决策树分类能力的不同对其进行优化,获得叶节点的投票权重,最终采取多棵决策树投票法得出随机森林的结果。实验证明,改进后PSO优化的随机森林算法的准确度可比传统的随机森林算法提升19.1%。 展开更多
关键词 粒子群算法 决策树 数据挖掘 加权随机森林 自适应优化
下载PDF
一种基于PSO优化加权随机森林算法的上市公司信用评级模型设计 被引量:34
16
作者 马晓君 董碧滢 王常欣 《数量经济技术经济研究》 CSSCI CSCD 北大核心 2019年第12期165-182,共18页
研究目标:根据企业财务比率数据,将企业经营状况通过评级机构所公布的信用级别反映出来。研究方法:本文针对传统随机森林模型在投票机制中存在的弊端,通过改进指标选取、重要性排序及算法优化三个方面,创新性地将PSO算法运用于基于加权... 研究目标:根据企业财务比率数据,将企业经营状况通过评级机构所公布的信用级别反映出来。研究方法:本文针对传统随机森林模型在投票机制中存在的弊端,通过改进指标选取、重要性排序及算法优化三个方面,创新性地将PSO算法运用于基于加权随机森林模型的企业信用评级中,并对2016年2840家中国上市企业的财务数据进行应用分析。研究发现:采用PSO优化加权随机森林模型的上市公司信用评级准确率有所提高;其评级准确率普遍优于传统的决策树、支持向量机和随机森林模型;制造业企业信用评级状况不佳,被标记为财务危险的企业占比较多。研究创新:在企业信用评级领域提出一种基于PSO优化加权随机森林模型。研究价值:为完善企业信用评级体系提供新思路。 展开更多
关键词 上市公司 企业信用评级 加权随机森林 粒子群优化
原文传递
基于改进随机森林算法的工业过程运行状态评价 被引量:17
17
作者 常玉清 孙雪婷 +2 位作者 钟林生 王福利 刘英娇 《自动化学报》 EI CAS CSCD 北大核心 2021年第9期2214-2225,共12页
运行状态评价是指在过程正常生产的前提下,进一步判断生产过程运行状态的优劣.针对复杂工业过程定量信息与定性信息共存的情况,本文提出了一种基于随机森林的工业过程运行状态评价方法.针对随机森林中决策树信息存在冗余的问题,基于互... 运行状态评价是指在过程正常生产的前提下,进一步判断生产过程运行状态的优劣.针对复杂工业过程定量信息与定性信息共存的情况,本文提出了一种基于随机森林的工业过程运行状态评价方法.针对随机森林中决策树信息存在冗余的问题,基于互信息将传统随机森林中的决策树进行分组,并选出每组中最优的决策树组成新的随机森林.同时为了强化评价精度高的决策树和弱化评价精度低的决策树对最终评价结果的影响,使用加权投票机制取代传统众数投票方法,最终构成一种基于互信息的加权随机森林算法(Mutual information weighted random forest,MIWRF).对于在线评价,本文通过计算在线数据处于各个等级的概率,并且结合提出的在线评价策略,判定当前样本运行状态等级.为了验证所提算法的有效性,将所提方法应用于湿法冶金浸出过程,实验结果表明,相对于传统随机森林算法,MIWRF降低了模型的复杂度,同时提高了运行状态评价精度. 展开更多
关键词 湿法冶金 运行状态评价 互信息 加权随机森林
下载PDF
随机森林和水平集的椎骨CT分割方法 被引量:2
18
作者 陶永鹏 景雨 顼聪 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1336-1339,共4页
由于椎骨间的形态差距较小、椎体的结构较为复杂,椎骨的CT图像分割处理近来成为医学研究的热门话题之一.本文针对脊柱CT图像水平集分割方法对初始轮廓敏感问题,提出了基于加权随机森林和水平集模型的有效椎骨CT分割方法WRF-CV(Wighted R... 由于椎骨间的形态差距较小、椎体的结构较为复杂,椎骨的CT图像分割处理近来成为医学研究的热门话题之一.本文针对脊柱CT图像水平集分割方法对初始轮廓敏感问题,提出了基于加权随机森林和水平集模型的有效椎骨CT分割方法WRF-CV(Wighted Random forest-Chan Vese).本文方法提取图像的SIFT特征,利用加权随机森林回归算法获得脊柱中心点位置,并将平稳控制演化速度和噪声敏感度的水平集分割模型初始轮廓置于预测中心点处,通过求解能量函数演化方程最小值来实现椎骨分割.本文对5190张CT图像进行了评估,方法在椎骨分割测试中得到较好的分割效果,可以更加有效准确地分割椎骨CT图像. 展开更多
关键词 椎骨CT 图像分割 加权随机森林 CV模型
下载PDF
基于KPCA-IF-WRF模型的多源VOCs数据清洗方法研究 被引量:7
19
作者 黄光球 赵羲轩 陆秋琴 《安全与环境学报》 CAS CSCD 北大核心 2022年第6期3412-3423,共12页
为了解决多源挥发性有机物(Volatile Organic Compounds,VOCs)数据存在数据维度高、数据关系复杂、数据存在异常的问题,建立了基于核主成分分析(Kernel Principal Component Analysis,KPCA)、孤立森林(Isolated Forest,IF)、加权随机森... 为了解决多源挥发性有机物(Volatile Organic Compounds,VOCs)数据存在数据维度高、数据关系复杂、数据存在异常的问题,建立了基于核主成分分析(Kernel Principal Component Analysis,KPCA)、孤立森林(Isolated Forest,IF)、加权随机森林(Weighted Random Forest,WRF)混合方法的VOCs数据清洗模型。首先对研究区域进行网格划分,建立了基于KPCA-IF的VOCs降维异常数据识别模型,通过KPCA方法对多源混合VOCs数据降维,使用IF算法识别异常数据并进行剔除。然后设计了基于WRF的VOCs数据补偿算法,对降维与异常识别后的数据集进行缺失值回归填补。最后,以西安市为例,选取空气质量数据、气象数据等多源VOCs数据进行数据清洗。结果表明,该混合模型可有效对多源VOCs数据降维,进行数据清洗的平均绝对误差为5.08、均方根误差为10.24、中值绝对误差为3.54,均优于对比模型,证明了KPCA-IF-WRF混合模型的鲁棒性更强、精确度更高,具有科学性和可行性。 展开更多
关键词 环境工程学 挥发性有机物 数据清洗 核主成分分析 孤立森林 加权随机森林
下载PDF
基于IPSO-WRF的选择性激光烧结件气泡溶解时间预测模型 被引量:3
20
作者 张天瑞 魏铭琦 高秀秀 《计算机科学》 CSCD 北大核心 2021年第S02期638-643,共6页
针对选择性激光烧结(Selective Laser Sintering,SLS)件成型过程中因气泡导致的质量缺陷问题,提出一种基于改进粒子群(Improved Particle Swarm Optimization,IPSO)算法优化的加权随机森林(Weighted Random Forest,WRF)预测方法,用于实... 针对选择性激光烧结(Selective Laser Sintering,SLS)件成型过程中因气泡导致的质量缺陷问题,提出一种基于改进粒子群(Improved Particle Swarm Optimization,IPSO)算法优化的加权随机森林(Weighted Random Forest,WRF)预测方法,用于实现气泡溶解时间的有效预测。该方法利用IPSO算法优化WRF分裂属性个数和决策树数量两个关键参数,构建IPSO-WRF预测模型。数值实例表明,与PSO-RF,PSO-KELM预测模型的预测结果相比,基于相同的训练样本和测试样本,气泡溶解时间IPSO-WRF的预测模型能够获得误差更小且更接近于实际值的输出结果。MAE,MAPE,RMSE指标表明,IPSO-WRF预测模型具有比PSO-RF模型和PSO-KELM模型更高的非线性拟合能力和预测精度。最后,通过敏感性分析确定对气泡溶解时间影响最显著的输入参数,为SLS技术的发展提供理论依据。 展开更多
关键词 选择性激光烧结 气泡溶解时间 改进粒子群算法 加权随机森林 参数敏感性分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部