期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于加权深度森林算法的公安敏感数据流动态挖掘研究
1
作者 陈予雯 《中国人民警察大学学报》 2024年第6期23-28,共6页
公安敏感数据流隐蔽性与复杂性较高,数据挖掘过程中难以对这些数据进行分类,导致数据挖掘质量下降。为解决这一问题,提出基于加权深度森林算法的公安敏感数据流动态挖掘方法。该方法利用本地化差分隐私技术,采集公安部门终端应用的敏感... 公安敏感数据流隐蔽性与复杂性较高,数据挖掘过程中难以对这些数据进行分类,导致数据挖掘质量下降。为解决这一问题,提出基于加权深度森林算法的公安敏感数据流动态挖掘方法。该方法利用本地化差分隐私技术,采集公安部门终端应用的敏感数据流,再根据最大类间散度获取敏感数据流向量,通过计算最佳散度提取公安敏感数据流可挖掘特征,然后结合可挖掘特征使用加权深度森林算法求解敏感数据流类别密度,引入孤立因子对数据流进行动态分类,实现公安敏感数据流动态挖掘,实际应用效果较好。 展开更多
关键词 加权深度森林 敏感数据流 动态挖掘 差分隐私 可挖掘特征 孤立因子
下载PDF
考虑不确定性的TBM施工速度加权随机森林预测模型 被引量:1
2
作者 闫长斌 高子昂 +4 位作者 姚西桐 汪鹤健 杨风威 杨继华 卢高明 《岩土工程学报》 EI CAS CSCD 北大核心 2023年第12期2575-2583,共9页
TBM施工速度影响因素众多,具有显著的不确定性。对于地质参数的模糊性,采用岩体分级系统RMR、岩石耐磨性CAI和岩石硬度H衡量地质条件;对于施工过程中机械参数的随机性,利用TBM刀盘推力TF与转速RPM等主动控制参数进行分析;同时提出以其... TBM施工速度影响因素众多,具有显著的不确定性。对于地质参数的模糊性,采用岩体分级系统RMR、岩石耐磨性CAI和岩石硬度H衡量地质条件;对于施工过程中机械参数的随机性,利用TBM刀盘推力TF与转速RPM等主动控制参数进行分析;同时提出以其他因素停机时间占比来量化人为因素的不确定性。依托兰州水源地建设工程输水隧洞双护盾TBM施工实测数据,建立了考虑不确定性的TBM施工速度预测数据库和加权随机森林算法模型,并与随机森林、支持向量回归、BP神经网络等预测方法进行了对比分析。研究表明,加权随机森林模型中测试集的预测结果均方根误差和决定系数分别为1.59,0.97,预测精度及可靠性均优于其他3种模型。该模型采用不同权重赋值的方法优化超参数,具有高精度、不易过拟合等优点,表现出更好的泛化能力和鲁棒性。 展开更多
关键词 隧道掘进机(TBM) 施工速度 不确定性 加权随机森林 支持向量回归 神经网络 预测模型
下载PDF
基于地理加权随机森林的青藏地区放牧强度时空格局模拟 被引量:1
3
作者 李兰晖 黄聪聪 +5 位作者 张镱锂 刘林山 王兆锋 张海燕 丁明军 张华敏 《地理科学》 CSCD 北大核心 2023年第3期398-410,共13页
精确刻画放牧强度时空格局是深刻理解青藏地区高寒草地服务功能动态及其驱动机制的重要基础,对辅助制定区域生态安全和可持续发展战略具有意义。基于牲畜年末存栏量、牧区人口密度、生长季NDVI、年降水量、年平均气温和居民点分布等数据... 精确刻画放牧强度时空格局是深刻理解青藏地区高寒草地服务功能动态及其驱动机制的重要基础,对辅助制定区域生态安全和可持续发展战略具有意义。基于牲畜年末存栏量、牧区人口密度、生长季NDVI、年降水量、年平均气温和居民点分布等数据,采用地理加权随机森林模型,模拟了2000年、2010年和2020年3期青藏地区放牧强度的空间格局,并定量评价了环境因子对放牧强度空间分布解释性的区域差异。结果表明:(1)地理加权随机森林模拟结果可精细地刻画青藏地区放牧强度的空间特征,与经典随机森林模型相比,判定系数更高,平均绝对值误差和均方根误差更低。(2)青藏地区放牧强度呈现东南高、西北低的基本特征,其中,西北部地区放牧强度低于25羊单位/km~2的区域约占青藏地区面积的1/2。(3)与2000年和2010年相比,2020年青藏地区放牧强度呈现总体下降、局部抬升的态势;其中,较2010年,2020年放牧强度下降超过1羊单位/km~2的区域占牧区面积的61.69%。(4)牧区人口密度是解释放牧强度空间异质性最主要的因素,其相对重要性呈现西高东低的特征,而降水量和生长季NDVI的相对重要性则呈现西北高、东南低的特征。研究结论可为青藏地区草地可持续管理和生态安全屏障建设提供科学参考。 展开更多
关键词 放牧强度 地理加权随机森林 牧区人口密度 青藏地区
下载PDF
基于校友数据的大学生就业影响因素加权随机森林模型 被引量:1
4
作者 王小龙 穆芸菲 +4 位作者 朱玥祺 寇子若 谢佳美 李涓涓 郭晓明 《电脑知识与技术》 2023年第1期81-84,87,共5页
为了更好地分析利用校友经济新形势下的就业数据,建立了影响大学生就业因素的加权随机森林模型。首先对影响就业的因素进行排序,然后通过加权随机森林模型,准确预测在校生未来就业情况,在此基础上充分利用校友资源并搭建平台为学生就业... 为了更好地分析利用校友经济新形势下的就业数据,建立了影响大学生就业因素的加权随机森林模型。首先对影响就业的因素进行排序,然后通过加权随机森林模型,准确预测在校生未来就业情况,在此基础上充分利用校友资源并搭建平台为学生就业创造机遇,加强与校友之间的联系,有效推进大学生就业工作。以某大学部分校友数据为实例,得到构建的模型预测准确率为82.3%。 展开更多
关键词 校友资源 加权随机森林 算法实现 就业预测 小程序
下载PDF
融合加权随机森林的自动3D椎骨CT图像主动轮廓分割方法 被引量:4
5
作者 刘侠 甘权 +2 位作者 李冰 刘晓 王波 《光电工程》 CAS CSCD 北大核心 2020年第12期35-46,共12页
为了解决CT图像主动轮廓分割方法对初始轮廓的敏感和分割不准确的问题,本文提出一种融合加权随机森林的自动3D椎骨CT主动轮廓分割方法WRF-AC。该方法提出加权随机森林算法和包含边缘能量的主动轮廓能量函数。首先,通过提取椎骨CT的3D Ha... 为了解决CT图像主动轮廓分割方法对初始轮廓的敏感和分割不准确的问题,本文提出一种融合加权随机森林的自动3D椎骨CT主动轮廓分割方法WRF-AC。该方法提出加权随机森林算法和包含边缘能量的主动轮廓能量函数。首先,通过提取椎骨CT的3D Haar-like特征值训练加权随机森林获得的椎骨中心作为分割的初始轮廓,然后,求解包含边缘能量的主动轮廓能量函数最小值完成椎骨CT图像的分割。实验结果表明,本方法在相同数据集上能够更加准确、快速地分割脊柱CT图像提取椎骨部分。 展开更多
关键词 3D分割 CT图像 加权随机森林 主动轮廓
下载PDF
基于加权随机森林的番茄氮元素缺乏分级模型研究 被引量:1
6
作者 李莉 蓝天 +1 位作者 赵奇慧 孟繁佳 《农业机械学报》 EI CAS CSCD 北大核心 2021年第11期219-225,262,共8页
基于叶面颜色特征建立番茄氮元素缺乏分级模型判别准确率可达0.8以上。夏季定植的番茄叶片表面会覆盖粘质腺毛,粘质腺毛利于番茄吸收水分和营养元素,相同营养液氮离子浓度下叶片黄化过程异于未覆盖粘质腺毛的叶片。故仅基于叶面颜色特... 基于叶面颜色特征建立番茄氮元素缺乏分级模型判别准确率可达0.8以上。夏季定植的番茄叶片表面会覆盖粘质腺毛,粘质腺毛利于番茄吸收水分和营养元素,相同营养液氮离子浓度下叶片黄化过程异于未覆盖粘质腺毛的叶片。故仅基于叶面颜色特征建立分级模型,其准确率降至0.65。覆盖粘质腺毛番茄其叶片周长和叶面积两个形状特征均小于未覆盖粘质腺毛的番茄叶片,本文将番茄叶片两个形状特征结合原有叶面颜色特征共同作为模型输入,建立新的番茄氮元素缺乏分级模型。搭建图像采集系统,该图像采集单元由树莓派和其相机模块构建,使用WiFi或4G网络完成智能手机、图像采集单元、本地计算机之间无线数据传输。智能手机通过Web界面可远程控制采集图像并将图像传输到云平台存储。本地计算机对图像进行预处理提取叶片形状、颜色特征后输入模型进行预测,并输出预测结果。试验结果表明,图像采集系统春季和夏季平均温度在19.7~28.3℃范围内,光照在1125~9543 lx范围内均可正常使用,采集的图像经预处理分割后降低了环境光线的影响。使用优化后的加权随机森林模型,基于形状特征和颜色特征相结合的叶片氮元素缺乏分级判别准确率可达0.83。 展开更多
关键词 番茄 氮元素 形状特征 颜色特征 判别分级 加权随机森林
下载PDF
特征重排序的加权深度森林 被引量:1
7
作者 周博文 皋军 《软件导刊》 2021年第9期7-13,共7页
传统深度森林模型由于局限性,在多粒度扫描特征转换阶段忽略了边缘信息,导致特征转换不充分;级联时将上一层类概率拼接到原始特征中,未考虑之前类概率向量的影响,最后投票过程忽视了子分类器权重。针对以上问题,提出一种特征重排序的深... 传统深度森林模型由于局限性,在多粒度扫描特征转换阶段忽略了边缘信息,导致特征转换不充分;级联时将上一层类概率拼接到原始特征中,未考虑之前类概率向量的影响,最后投票过程忽视了子分类器权重。针对以上问题,提出一种特征重排序的深度森林(Reorder Feature Deep Forest,RFDF)算法,通过特征重排序,将较重要的特征排在中部转换出更有效的特征;级联阶段将之前层级生成的类概率向量之间的差作为增强特征与原特征拼接,进一步增强特征差异性,缓解网络退化现象。引入逻辑回归分类器,增加子分类器的差异性。最后结果由赋予权重后的子分类器投票得出。通过不同的数据集验证,表明该方法一定程度上有效,在高维数据集上表现更加明显。 展开更多
关键词 深度森林 特征重排序 增强特征 加权森林
下载PDF
基于加权深度森林的长白山风景区客流量预测
8
作者 秦喜文 陈冬雪 +2 位作者 占贻畅 尹冬梅 董小刚 《长春工业大学学报》 CAS 2022年第4期587-592,共6页
提出一种改进的加权深度森林方法。主要通过筛选多粒度扫描产生的子样本,使预测结果性能更好。选取长白山风景区客流量数据集作为样本,将随机森林、支持向量机和原始深度森林等作为对比方法,验证了模型的有效性。结果表明,提出的算法R^... 提出一种改进的加权深度森林方法。主要通过筛选多粒度扫描产生的子样本,使预测结果性能更好。选取长白山风景区客流量数据集作为样本,将随机森林、支持向量机和原始深度森林等作为对比方法,验证了模型的有效性。结果表明,提出的算法R^(2)为0.9586,明显高于其他方法。该算法能有效提高客流量预测的准确性,对旅游业的发展具有重要的理论意义与实用价值。 展开更多
关键词 加权深度森林 多粒度扫描 旅游客流量预测 评价指标
下载PDF
基于加权随机森林的FDD-LTE上行干扰分类研究
9
作者 许鸿奎 李鑫 +2 位作者 邵星 姜彤彤 宫淑兰 《山东建筑大学学报》 2020年第6期23-29,共7页
研究和应用加权随机森林算法可以有效地解决频分双工—长期演进(FDD-LTE)网络中上行干扰数据存在不平衡的问题,是提高上行干扰分类准确率的有效方法。文章针对测量报告(MR)数据中的上行平均干扰电平,建立了一种基于加权随机森林的上行... 研究和应用加权随机森林算法可以有效地解决频分双工—长期演进(FDD-LTE)网络中上行干扰数据存在不平衡的问题,是提高上行干扰分类准确率的有效方法。文章针对测量报告(MR)数据中的上行平均干扰电平,建立了一种基于加权随机森林的上行干扰分类模型,并设置了类权重参数,对比分析了决策树、随机森林和加权随机森林等3种算法的分类效果。结果表明:加权随机森林能够提升不平衡数据中数量较少类的分类正确率,其互调干扰和阻塞干扰的分类正确率分别达到73.91%和96.67%;在不平衡的FDD-LTE上行干扰分类中,加权随机森林能够取得优于决策树和传统随机森林的结果,其分类正确率达到96.22%,而运行时间仅有0.98 s。 展开更多
关键词 FDD-LTE 上行干扰 不平衡数据 加权随机森林
下载PDF
加权随机森林和代价敏感支持向量机与心衰患者死亡风险评估 被引量:3
10
作者 杨弘 田晶 +6 位作者 孟冰霞 张瑜 罗艳虹 王可 郑楚 韩清华 张岩波 《中国卫生统计》 CSCD 北大核心 2022年第3期381-384,388,共5页
目的 探讨加权随机森林和代价敏感支持向量机模型在慢性心衰死亡风险评估中的应用。方法 利用AUC-RF自变量筛选方法选出与心衰死亡的相关因素,将选出的变量作为输入变量,预后有无死亡作为结局变量构建传统随机森林、支持向量机、logisti... 目的 探讨加权随机森林和代价敏感支持向量机模型在慢性心衰死亡风险评估中的应用。方法 利用AUC-RF自变量筛选方法选出与心衰死亡的相关因素,将选出的变量作为输入变量,预后有无死亡作为结局变量构建传统随机森林、支持向量机、logistic回归、加权随机森林和代价敏感支持向量机分类预测模型。结果 AUC-RF筛选出的变量中有中枢系统疾病史、肾功能不全史、心包积液、BMI、中性粒细胞比值、肾小球滤过率、N端前脑钠肽等指标重要度较高,提示这些指标或有临床意义。评价指标有灵敏度、特异度、准确度、G-means、F-measure和AUC值,logistic模型评价指标的中位数分别为:78.46%、63.19%、81.4%、0.6933、0.467和0.7003;加权随机森林评价指标分别为:78.08%、82.74%、85.96%、0.8086、0.4853和0.8109;代价敏感支持向量机评价指标分别为:75.38%、72.49%、88.8%、0.7402、0.4749和0.7940。结论 加权随机森林模型对心衰患者预后死亡预测性能较高,该模型有助于临床医生识别心衰死亡危险因素,具有较高应用价值。 展开更多
关键词 慢性心衰 疾病预后 加权随机森林 代价敏感支持向量机
下载PDF
基于加权随机森林的三阴性乳腺癌microRNA组学数据的分类预测 被引量:1
11
作者 郭志飞 王碧珏 +4 位作者 杨海涛 李治 王菊平 曹红艳 周立业 《中国卫生统计》 CSCD 北大核心 2020年第6期809-812,817,共5页
目的基于microRNA组学数据,探讨加权随机森林在三阴性乳腺癌分类预测中的应用,为疾病诊断提供方法学支撑。方法以TCGA乳腺癌数据为例,采用加权随机森林构建三阴性乳腺癌的分类预测模型,并与随机森林、logistic回归、支持向量机、LASSO... 目的基于microRNA组学数据,探讨加权随机森林在三阴性乳腺癌分类预测中的应用,为疾病诊断提供方法学支撑。方法以TCGA乳腺癌数据为例,采用加权随机森林构建三阴性乳腺癌的分类预测模型,并与随机森林、logistic回归、支持向量机、LASSO和岭回归五种模型进行比较。结果通过比较六种模型的5个评价指标,加权随机森林模型的预测性能明显优于其他五种模型,加权随机森林模型的灵敏度为0.852、特异度为0.873、准确度为0.871、AUC值为0.862和G-means值为0.861。结论加权随机森林构建的分类预测模型较好地识别了三阴性乳腺癌患者,可为三阴性乳腺癌的诊断提供方法学上的参考。 展开更多
关键词 加权随机森林 分类预测 MICRORNA 三阴性乳腺癌
下载PDF
航空电弧故障的组合加权随机森林分类方法 被引量:1
12
作者 桑益芹 葛红娟 +2 位作者 李静 潘姝越 李煌 《航空计算技术》 2022年第2期77-81,共5页
针对现有电弧时频域分析适用范围存在局限性,以及电弧故障分类未考虑特征价值量的问题,提出以电弧能量为时域特征、以电弧电流为频域特征的组合加权随机森林电弧故障分类方法。通过离散分数阶傅里叶变换分析频域特征,以类散度作为评价... 针对现有电弧时频域分析适用范围存在局限性,以及电弧故障分类未考虑特征价值量的问题,提出以电弧能量为时域特征、以电弧电流为频域特征的组合加权随机森林电弧故障分类方法。通过离散分数阶傅里叶变换分析频域特征,以类散度作为评价指标得到时频域的特征价值量,结合由随机森林自检测功能得到的特征重要度,构建新的组合权重。在纯阻、阻感、阻容性条件下,以航空28 V、270 V直流串联和并联电弧为研究对象,比较所提方法和现有随机森林的故障分类效果。结果表明,采用的时域和频域特征能有效区分不同电压和负载条件下的电弧故障程度,提出的加权随机森林比现有随机森林的故障分类准确率提高了2.44%,诊断效果更好。 展开更多
关键词 航空电弧故障 故障分类 时频域特征 特征价值量 加权随机森林
下载PDF
基于加权随机森林算法的虚拟试衣型号推荐技术研究 被引量:1
13
作者 李涛 冯向阳 《智能计算机与应用》 2019年第4期116-124,共9页
随着体感交互技术的发展,基于Kinect的虚拟试衣系统为顾客在线选购衣物提供了一种新的选择方案.Kinect可以较为准确地测量出人体的骨骼模型,生成人体三维数据,以进一步为顾客推荐衣服型号,并利用可视化技术进行虚拟试装.然而,人的体型不... 随着体感交互技术的发展,基于Kinect的虚拟试衣系统为顾客在线选购衣物提供了一种新的选择方案.Kinect可以较为准确地测量出人体的骨骼模型,生成人体三维数据,以进一步为顾客推荐衣服型号,并利用可视化技术进行虚拟试装.然而,人的体型不同,不同厂家的制衣型号也不规范,传统的数据筛选与匹配手段为顾客选择的衣服尺码总是不尽人意.本项目基于Kinect获取的人体三维数据,设计了一种加权随机森林方法为顾客预测并推荐合适的衣服型号.结合其它机器学习模型,本文进行了对比实验,结果表明随机森林模型有效而准确,在3000个测试样本上得到了最高的准确率(100%).该模型泛化能力强,且足够健壮稳定,可以广泛地应用在虚拟试衣型号推荐情景中. 展开更多
关键词 虚拟试衣型号 KINECT 加权随机森林
下载PDF
基于加权随机森林算法的空巢电力用户识别方法 被引量:2
14
作者 卢子萌 陈佳怡 +4 位作者 李璟 谢岳 蒋欣利 韩蕾 郭倩 《电信科学》 2020年第8期112-121,共10页
针对当前政府和社会对空巢老人的识别缺乏有效技术手段的问题,提出了一种基于加权随机森林算法的空巢电力用户识别方法。首先通过调查问卷获取部分准确空巢用户标签,并从用电水平、用电波动、用电趋势3个方面构建用户用电特征库,由于空... 针对当前政府和社会对空巢老人的识别缺乏有效技术手段的问题,提出了一种基于加权随机森林算法的空巢电力用户识别方法。首先通过调查问卷获取部分准确空巢用户标签,并从用电水平、用电波动、用电趋势3个方面构建用户用电特征库,由于空巢与非空巢存在用户数据不平衡问题,采用加权随机森林算法改善机器学习对数据敏感的现象,将该算法模型在电力公司采集系统部署上线,并对2000户未知类型用户进行空巢识别,其空巢识别准确率达到74.2%。结果表明,从用电角度研究对空巢老人的识别,可以帮助电网公司了解空巢老人的个性化、差异化需求,从而为用户提供更精细的服务,也可以协助政府和社会开展帮扶工作。 展开更多
关键词 空巢用户识别 加权随机森林算法 用户用电特征库 数据不平衡
下载PDF
基于PSO优化的叶节点加权随机森林算法 被引量:1
15
作者 胡明祺 张森昶 《现代计算机》 2022年第4期1-4,共4页
随机森林算法(random forest)是属于集成学习的一种组合分类方法,作为一种重要的机器学习算法,随机森林算法普遍适用于大部分数据集。通过使用PSO算法优化并采用对叶节点加权的方式,可以改善传统随机森林算法的性能,提升其分类能力。利... 随机森林算法(random forest)是属于集成学习的一种组合分类方法,作为一种重要的机器学习算法,随机森林算法普遍适用于大部分数据集。通过使用PSO算法优化并采用对叶节点加权的方式,可以改善传统随机森林算法的性能,提升其分类能力。利用PSO算法全局搜索能力强、收敛速度快的优势,根据决策树分类能力的不同对其进行优化,获得叶节点的投票权重,最终采取多棵决策树投票法得出随机森林的结果。实验证明,改进后PSO优化的随机森林算法的准确度可比传统的随机森林算法提升19.1%。 展开更多
关键词 粒子群算法 决策树 数据挖掘 加权随机森林 自适应优化
下载PDF
基于改进随机森林算法的工业过程运行状态评价 被引量:13
16
作者 常玉清 孙雪婷 +2 位作者 钟林生 王福利 刘英娇 《自动化学报》 EI CAS CSCD 北大核心 2021年第9期2214-2225,共12页
运行状态评价是指在过程正常生产的前提下,进一步判断生产过程运行状态的优劣.针对复杂工业过程定量信息与定性信息共存的情况,本文提出了一种基于随机森林的工业过程运行状态评价方法.针对随机森林中决策树信息存在冗余的问题,基于互... 运行状态评价是指在过程正常生产的前提下,进一步判断生产过程运行状态的优劣.针对复杂工业过程定量信息与定性信息共存的情况,本文提出了一种基于随机森林的工业过程运行状态评价方法.针对随机森林中决策树信息存在冗余的问题,基于互信息将传统随机森林中的决策树进行分组,并选出每组中最优的决策树组成新的随机森林.同时为了强化评价精度高的决策树和弱化评价精度低的决策树对最终评价结果的影响,使用加权投票机制取代传统众数投票方法,最终构成一种基于互信息的加权随机森林算法(Mutual information weighted random forest,MIWRF).对于在线评价,本文通过计算在线数据处于各个等级的概率,并且结合提出的在线评价策略,判定当前样本运行状态等级.为了验证所提算法的有效性,将所提方法应用于湿法冶金浸出过程,实验结果表明,相对于传统随机森林算法,MIWRF降低了模型的复杂度,同时提高了运行状态评价精度. 展开更多
关键词 湿法冶金 运行状态评价 互信息 加权随机森林
下载PDF
随机森林和水平集的椎骨CT分割方法 被引量:2
17
作者 陶永鹏 景雨 顼聪 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1336-1339,共4页
由于椎骨间的形态差距较小、椎体的结构较为复杂,椎骨的CT图像分割处理近来成为医学研究的热门话题之一.本文针对脊柱CT图像水平集分割方法对初始轮廓敏感问题,提出了基于加权随机森林和水平集模型的有效椎骨CT分割方法WRF-CV(Wighted R... 由于椎骨间的形态差距较小、椎体的结构较为复杂,椎骨的CT图像分割处理近来成为医学研究的热门话题之一.本文针对脊柱CT图像水平集分割方法对初始轮廓敏感问题,提出了基于加权随机森林和水平集模型的有效椎骨CT分割方法WRF-CV(Wighted Random forest-Chan Vese).本文方法提取图像的SIFT特征,利用加权随机森林回归算法获得脊柱中心点位置,并将平稳控制演化速度和噪声敏感度的水平集分割模型初始轮廓置于预测中心点处,通过求解能量函数演化方程最小值来实现椎骨分割.本文对5190张CT图像进行了评估,方法在椎骨分割测试中得到较好的分割效果,可以更加有效准确地分割椎骨CT图像. 展开更多
关键词 椎骨CT 图像分割 加权随机森林 CV模型
下载PDF
基于地理加权随机森林的长三角PM_(2.5)建模
18
作者 陈艺敏 苏漳文 +1 位作者 陈移萍 林子彭 《中国环境科学》 EI CAS 2024年第8期4240-4248,共9页
采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标... 采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标均优于RF模型,且GWRF模型残差的空间自相关性更低.(2)GWRF模型预测2019年PM_(2.5)浓度分布优于RF模型,与实际观测浓度分布基本一致,但两个模型均存在北部高估南部低估的情况,且高估区域大于低估区域.(3)RF模型在研究PM_(2.5)浓度分布最重要且显著的驱动因子方面是全局性的,而GWRF模型得到干旱、气温、温差、风速以及人类干扰对PM_(2.5)分布的影响是局部性的.在大尺度下,这种局部性的效应对于PM_(2.5)精细化防控更具实际性的指导意义.此外,在全球气候暖干化和区域气候空间异质性的背景下,把干旱融入PM_(2.5)预测并建立具有局部效应的模型有助于环境监管机构及决策者制定防控措施. 展开更多
关键词 PM_(2.5)驱动因素 地理加权随机森林 空间效应 长三角地区
下载PDF
基于DE-VRF的猪声音分类识别
19
作者 顾小平 吴浩 +2 位作者 陈佳豪 胡潇涛 宋弘 《计算机应用与软件》 北大核心 2023年第3期241-247,共7页
为了监测识别生猪健康状况以及情绪状态,提出一种基于差分进化优化加权随机森林(DE-VRF)猪只声音分类模型,以猪只咳嗽、尖叫和进食声作为研究对象,经预处理后提取改进的梅尔倒谱系数(MFCC_F)、短时能量和短时过零率进行特征融合。采用... 为了监测识别生猪健康状况以及情绪状态,提出一种基于差分进化优化加权随机森林(DE-VRF)猪只声音分类模型,以猪只咳嗽、尖叫和进食声作为研究对象,经预处理后提取改进的梅尔倒谱系数(MFCC_F)、短时能量和短时过零率进行特征融合。采用主成分分析法(PCA)将特征参数降至13维,利用差分进化算法优化加权随机森林模型参数,将融合特征参数输入DE-VRF进行训练与识别。实验结果表明,基于DE-VRF模型的猪只声音平均识别率达96.34%,较DNN、1D-CNN模型相比提高了系统识别的性能。 展开更多
关键词 生猪 声音信号 差分进化 加权随机森林 分类识别
下载PDF
一种基于PSO优化加权随机森林算法的上市公司信用评级模型设计 被引量:30
20
作者 马晓君 董碧滢 王常欣 《数量经济技术经济研究》 CSSCI CSCD 北大核心 2019年第12期165-182,共18页
研究目标:根据企业财务比率数据,将企业经营状况通过评级机构所公布的信用级别反映出来。研究方法:本文针对传统随机森林模型在投票机制中存在的弊端,通过改进指标选取、重要性排序及算法优化三个方面,创新性地将PSO算法运用于基于加权... 研究目标:根据企业财务比率数据,将企业经营状况通过评级机构所公布的信用级别反映出来。研究方法:本文针对传统随机森林模型在投票机制中存在的弊端,通过改进指标选取、重要性排序及算法优化三个方面,创新性地将PSO算法运用于基于加权随机森林模型的企业信用评级中,并对2016年2840家中国上市企业的财务数据进行应用分析。研究发现:采用PSO优化加权随机森林模型的上市公司信用评级准确率有所提高;其评级准确率普遍优于传统的决策树、支持向量机和随机森林模型;制造业企业信用评级状况不佳,被标记为财务危险的企业占比较多。研究创新:在企业信用评级领域提出一种基于PSO优化加权随机森林模型。研究价值:为完善企业信用评级体系提供新思路。 展开更多
关键词 上市公司 企业信用评级 加权随机森林 粒子群优化
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部