期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
A random forest algorithm based on similarity measure and dynamic weighted voting 被引量:1
1
作者 ZHAO Shu-xu MA Qin-jing LIU Li-jiao 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2019年第3期277-284,共8页
The random forest model is universal and easy to understand, which is often used for classification and prediction. However, it uses non-selective integration and the majority rule to judge the final result, thus the ... The random forest model is universal and easy to understand, which is often used for classification and prediction. However, it uses non-selective integration and the majority rule to judge the final result, thus the difference between the decision trees in the model is ignored and the prediction accuracy of the model is reduced. Taking into consideration these defects, an improved random forest model based on confusion matrix (CM-RF)is proposed. The decision tree cluster is selectively constructed by the similarity measure in the process of constructing the model, and the result is output by using the dynamic weighted voting fusion method in the final voting session. Experiments show that the proposed CM-RF can reduce the impact of low-performance decision trees on the output result, thus improving the accuracy and generalization ability of random forest model. 展开更多
关键词 random forest confusion matrix similarity measure dynamic weighted voting
下载PDF
基于Random Forest和AHP的贵德县北部山区滑坡危险性评价 被引量:17
2
作者 张向营 张春山 +3 位作者 孟华君 王雪冰 赵伟康 郑满城 《水文地质工程地质》 CAS CSCD 北大核心 2018年第4期142-149,共8页
滑坡危险性评价是滑坡灾害防治和管理的重要依据。文章基于层次分析法和随机森林模型,结合距离函数法,探索性地提出了一种新的组合赋权法(RF-AHP)。采用RF-AHP对青海省贵德县北部山区滑坡进行了危险性评价,对比探讨了AHP、RF和RF-AHP三... 滑坡危险性评价是滑坡灾害防治和管理的重要依据。文章基于层次分析法和随机森林模型,结合距离函数法,探索性地提出了一种新的组合赋权法(RF-AHP)。采用RF-AHP对青海省贵德县北部山区滑坡进行了危险性评价,对比探讨了AHP、RF和RF-AHP三种模型评价结果与实际滑坡灾害的吻合性,结果表明:(1)RF-AHP在高危险区和极高危险区面积占比38.38%的情况下,包括了60.13%的滑坡灾害,结果准确性相比AHP和RF两种模型有较大提升;(2)随着危险性等级的逐步提高,RF-AHP区划结果中相应分区的灾害实际发生的比率也随之增高,并对三种方法出现结果差异的客观原因进行了分析讨论,证明RF-AHP适用于滑坡危险性评价工作。 展开更多
关键词 滑坡危险性 组合赋权模型 层次分析法 随机森林法
下载PDF
Research on Optimization of Random Forest Algorithm Based on Spark 被引量:2
3
作者 Suzhen Wang Zhanfeng Zhang +1 位作者 Shanshan Geng Chaoyi Pang 《Computers, Materials & Continua》 SCIE EI 2022年第5期3721-3731,共11页
As society has developed,increasing amounts of data have been generated by various industries.The random forest algorithm,as a classification algorithm,is widely used because of its superior performance.However,the ra... As society has developed,increasing amounts of data have been generated by various industries.The random forest algorithm,as a classification algorithm,is widely used because of its superior performance.However,the random forest algorithm uses a simple random sampling feature selection method when generating feature subspaces which cannot distinguish redundant features,thereby affecting its classification accuracy,and resulting in a low data calculation efficiency in the stand-alone mode.In response to the aforementioned problems,related optimization research was conducted with Spark in the present paper.This improved random forest algorithm performs feature extraction according to the calculated feature importance to form a feature subspace.When generating a random forest model,it selects decision trees based on the similarity and classification accuracy of different decision.Experimental results reveal that compared with the original random forest algorithm,the improved algorithm proposed in the present paper exhibited a higher classification accuracy rate and could effectively classify data. 展开更多
关键词 random forest SPARK feature weight classification alg
下载PDF
Advancing climate resilience through a geo-design framework: strengthening urban and community forestry for sustainable environmental design
4
作者 Xiwei Shen Mingze Chen +4 位作者 Xiaowei Li Shu Gao Qiuyi Yang Yuhan Wen Qingqing Sun 《Journal of Forestry Research》 SCIE EI CAS CSCD 2024年第6期356-367,共12页
Urban and community forestry is a specialized discipline focused on the meticulous management of trees and forests within urban,suburban,and town environments.This field often entails extensive civic involvement and c... Urban and community forestry is a specialized discipline focused on the meticulous management of trees and forests within urban,suburban,and town environments.This field often entails extensive civic involvement and collaborative partnerships with institutions.Its overarching objectives span a spectrum from preserving water quality,habitat,and biodiversity to mitigating the Urban Heat Island(UHI)effect.The UHI phenomenon,characterized by notably higher temperatures in urban areas compared to rural counterparts due to heat absorption by urban infrastructure and limited urban forest coverage,serves as a focal point in this study.The study focuses on developing a methodological framework that integrates Geographically Weighted Regression(GWR),Random Forest(RF),and Suitability Analysis to assess the Urban Heat Island(UHI)effect across different urban zones,aiming to identify areas with varying levels of UHI impact.The framework is designed to assist urban planners and designers in understanding the spatial distribution of UHI and identifying areas where urban forestry initiatives can be strategically implemented to mitigate its effect.Conducted in various London areas,the research provides a comprehensive analysis of the intricate relationship between urban and community forestry and UHI.By mapping the spatial variability of UHI,the framework offers a novel approach to enhancing urban environmental design and advancing urban forestry studies.The study’s findings are expected to provide valuable insights for urban planners and policymakers,aiding in creating healthier and more livable urban environments through informed decision-making in urban forestry management. 展开更多
关键词 Urban and community forestry Urban heat island Geographically weighted regression random forest
下载PDF
基于KPCA-IF-WRF模型的多源VOCs数据清洗方法研究 被引量:7
5
作者 黄光球 赵羲轩 陆秋琴 《安全与环境学报》 CAS CSCD 北大核心 2022年第6期3412-3423,共12页
为了解决多源挥发性有机物(Volatile Organic Compounds,VOCs)数据存在数据维度高、数据关系复杂、数据存在异常的问题,建立了基于核主成分分析(Kernel Principal Component Analysis,KPCA)、孤立森林(Isolated Forest,IF)、加权随机森... 为了解决多源挥发性有机物(Volatile Organic Compounds,VOCs)数据存在数据维度高、数据关系复杂、数据存在异常的问题,建立了基于核主成分分析(Kernel Principal Component Analysis,KPCA)、孤立森林(Isolated Forest,IF)、加权随机森林(Weighted Random Forest,WRF)混合方法的VOCs数据清洗模型。首先对研究区域进行网格划分,建立了基于KPCA-IF的VOCs降维异常数据识别模型,通过KPCA方法对多源混合VOCs数据降维,使用IF算法识别异常数据并进行剔除。然后设计了基于WRF的VOCs数据补偿算法,对降维与异常识别后的数据集进行缺失值回归填补。最后,以西安市为例,选取空气质量数据、气象数据等多源VOCs数据进行数据清洗。结果表明,该混合模型可有效对多源VOCs数据降维,进行数据清洗的平均绝对误差为5.08、均方根误差为10.24、中值绝对误差为3.54,均优于对比模型,证明了KPCA-IF-WRF混合模型的鲁棒性更强、精确度更高,具有科学性和可行性。 展开更多
关键词 环境工程学 挥发性有机物 数据清洗 核主成分分析 孤立森林 加权随机森林
下载PDF
基于WRF模式的风电场短期风速集成预报方法研究 被引量:4
6
作者 叶小岭 支兴亮 邓华 《气象》 CSCD 北大核心 2019年第1期88-98,共11页
风能始源于大气的运动,具有很大的随机性和间歇性。风速预测是风电场风功率预测的基础,其准确性具有重要的意义。对于复杂地形条件下,风速的预报一直是各国研究的难点和重点。为了提高风电场短期风速预报的准确性,本研究采用多种边界层... 风能始源于大气的运动,具有很大的随机性和间歇性。风速预测是风电场风功率预测的基础,其准确性具有重要的意义。对于复杂地形条件下,风速的预报一直是各国研究的难点和重点。为了提高风电场短期风速预报的准确性,本研究采用多种边界层参数化方案来集成预报风速,将各单一边界层参数化方案预报的风速及相应的实测风速数据,应用随机森林算法建立集成预报模型,对风电场的短期风速进行集成预报研究。试验结果表明,采用集成预报风速方法,预报的风速误差相比于单一边界层参数化方案预报的风速误差明显减小,对研究区域的风速、风向等气象要素有着较好的模拟效果,能够有效提高风速预报的准确率。 展开更多
关键词 wrf模式 集成预报 边界层参数化方案 随机森林算法 预报效果
下载PDF
基于IPSO-WRF的选择性激光烧结件气泡溶解时间预测模型 被引量:3
7
作者 张天瑞 魏铭琦 高秀秀 《计算机科学》 CSCD 北大核心 2021年第S02期638-643,共6页
针对选择性激光烧结(Selective Laser Sintering,SLS)件成型过程中因气泡导致的质量缺陷问题,提出一种基于改进粒子群(Improved Particle Swarm Optimization,IPSO)算法优化的加权随机森林(Weighted Random Forest,WRF)预测方法,用于实... 针对选择性激光烧结(Selective Laser Sintering,SLS)件成型过程中因气泡导致的质量缺陷问题,提出一种基于改进粒子群(Improved Particle Swarm Optimization,IPSO)算法优化的加权随机森林(Weighted Random Forest,WRF)预测方法,用于实现气泡溶解时间的有效预测。该方法利用IPSO算法优化WRF分裂属性个数和决策树数量两个关键参数,构建IPSO-WRF预测模型。数值实例表明,与PSO-RF,PSO-KELM预测模型的预测结果相比,基于相同的训练样本和测试样本,气泡溶解时间IPSO-WRF的预测模型能够获得误差更小且更接近于实际值的输出结果。MAE,MAPE,RMSE指标表明,IPSO-WRF预测模型具有比PSO-RF模型和PSO-KELM模型更高的非线性拟合能力和预测精度。最后,通过敏感性分析确定对气泡溶解时间影响最显著的输入参数,为SLS技术的发展提供理论依据。 展开更多
关键词 选择性激光烧结 气泡溶解时间 改进粒子群算法 加权随机森林 参数敏感性分析
下载PDF
基于PSO-WRF的渭河中下游年径流预测模型 被引量:2
8
作者 郑恺原 向小华 吴晓玲 《水利水电技术》 北大核心 2020年第8期39-44,共6页
针对传统随机森林(RF)模型决策树因投票权重相同而导致预测精度不高的问题,采用加权随机森林(WRF)模型全面考虑各决策树分类能力的差异性,建立决策树加权投票机制;同时运用粒子群算法(PSO)进行参数全局寻优,避免依据经验选取参数的不科... 针对传统随机森林(RF)模型决策树因投票权重相同而导致预测精度不高的问题,采用加权随机森林(WRF)模型全面考虑各决策树分类能力的差异性,建立决策树加权投票机制;同时运用粒子群算法(PSO)进行参数全局寻优,避免依据经验选取参数的不科学性,通过二者耦合最终构建PSO-WRF模型。利用渭河中下游咸阳站与华县站1960—2009年的径流系列对RF、WRF、PSO-WRF三种模型进行训练及测试,结果表明,PSO-WRF在咸阳站与华县站的平均相对误差绝对值(MRE)分别为7.05%和9.41%,且均方根误差(RMSE)、平均绝对误差(MAE)等指标均降至优化前的30%~50%,各年预测误差最低可降低至优化前的1/3~1/6。PSO-WRF模型优化效果显著,表现出良好的预测精度和泛化能力,能够为相关径流预测研究提供一定参考。 展开更多
关键词 粒子群算法 随机森林 加权投票 径流预测
下载PDF
A Comparison of Selected Parametric and Non-Parametric Imputation Methods for Estimating Forest Biomass and Basal Area 被引量:1
9
作者 Donald Gagliasso Susan Hummel Hailemariam Temesgen 《Open Journal of Forestry》 2014年第1期42-48,共7页
Various methods have been used to estimate the amount of above ground forest biomass across landscapes and to create biomass maps for specific stands or pixels across ownership or project areas. Without an accurate es... Various methods have been used to estimate the amount of above ground forest biomass across landscapes and to create biomass maps for specific stands or pixels across ownership or project areas. Without an accurate estimation method, land managers might end up with incorrect biomass estimate maps, which could lead them to make poorer decisions in their future management plans. The goal of this study was to compare various imputation methods to predict forest biomass and basal area, at a project planning scale (a combination of ground inventory plots, light detection and ranging (LiDAR) data, satellite imagery, and climate data was analyzed, and their root mean square error (RMSE) and bias were calculated. Results indicate that for biomass prediction, the k-nn (k = 5) had the lowest RMSE and least amount of bias. The second most accurate method consisted of the k-nn (k = 3), followed by the GWR model, and the random forest imputation. For basal area prediction, the GWR model had the lowest RMSE and least amount of bias. The second most accurate method was k-nn (k = 5), followed by k-nn (k = 3), and the random forest method. For both metrics, the GNN method was the least accurate based on the ranking of RMSE and bias. 展开更多
关键词 Gradient Nearest NEIGHBOR MOST Similar NEIGHBOR K-Nearest NEIGHBOR random forest GEOGRAPHIC weighted Regression Biomass LiDAR
下载PDF
地质灾害易发性评价因子分级的AIFFC算法优化
10
作者 陈宾 李颖懿 +4 位作者 张联志 屈添强 魏娜 刘宁 黄春林 《中国地质灾害与防治学报》 CSCD 2024年第1期72-81,共10页
针对地质灾害易发性评价因子分级数不确定的问题,引入自适应膨胀因子模糊覆盖分级方法(fuzzy cover approach for clustering based on adaptive inflation factor,AIFFC)对易发性评价因子分级进行优化。以湖南省湘乡市为研究区,提取了... 针对地质灾害易发性评价因子分级数不确定的问题,引入自适应膨胀因子模糊覆盖分级方法(fuzzy cover approach for clustering based on adaptive inflation factor,AIFFC)对易发性评价因子分级进行优化。以湖南省湘乡市为研究区,提取了坡度、坡向、高程、年平均降雨量、归一化植被指数、道路、断层、岩性和土地利用9类评价因子,运用AIFFC及自然断点法(natural breakpoint classification,NBC)对连续型因子进行分级,并分别代入加权信息量模型和随机森林模型,获取研究区易发性区划图。采用单因子分级结果精度、灾积比分析和易发性分区结果对AIFFC分级法的优越性进行检验,结果表明:各因子采用AIFFC算法分级的AUC值均高于自然断点法;基于AIFFC的随机森林模型及加权信息量模型的高易发区灾积比分别提升了56.3%、74.6%,低易发区灾积比分别降低了48%、58.1%,AUC值分别提升了7.6%、2.7%。采用AIFFC分级方法优化了地质灾害易发性评价因子分级,显著提高了地质灾害易发性评价的合理性。 展开更多
关键词 膨胀因子 模糊覆盖 加权信息量 随机森林 易发性评价 地质灾害
下载PDF
基于地理加权随机森林的长三角PM_(2.5)建模
11
作者 陈艺敏 苏漳文 +1 位作者 陈移萍 林子彭 《中国环境科学》 EI CAS CSCD 北大核心 2024年第8期4240-4248,共9页
采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标... 采用随机森林(RF)和地理加权随机森林(GWRF)对长三角地区2003~2019年的PM_(2.5)浓度及其驱动因素数据进行训练、校验与测试,并探讨它们之间的关系.结果表明:(1)相比RF模型,GWRF模型对PM_(2.5)浓度的训练和预测更优,其各项模型评估指标均优于RF模型,且GWRF模型残差的空间自相关性更低.(2)GWRF模型预测2019年PM_(2.5)浓度分布优于RF模型,与实际观测浓度分布基本一致,但两个模型均存在北部高估南部低估的情况,且高估区域大于低估区域.(3)RF模型在研究PM_(2.5)浓度分布最重要且显著的驱动因子方面是全局性的,而GWRF模型得到干旱、气温、温差、风速以及人类干扰对PM_(2.5)分布的影响是局部性的.在大尺度下,这种局部性的效应对于PM_(2.5)精细化防控更具实际性的指导意义.此外,在全球气候暖干化和区域气候空间异质性的背景下,把干旱融入PM_(2.5)预测并建立具有局部效应的模型有助于环境监管机构及决策者制定防控措施. 展开更多
关键词 PM_(2.5)驱动因素 地理加权随机森林 空间效应 长三角地区
下载PDF
基于三维足迹家族模型的资源环境可持续性评价
12
作者 任黎 朱佳晨 宋姝萍 《水电能源科学》 北大核心 2024年第7期35-39,共5页
为探讨资源环境可持续评价研究的重要性,通过建立以生态足迹、水足迹与碳足迹为基本成员的足迹家族模型,引入多个资源环境压力指标,并基于DPSIR框架,运用综合集成法分析确立资源环境可持续性评价指标体系,由随机森林法与层次分析法确定... 为探讨资源环境可持续评价研究的重要性,通过建立以生态足迹、水足迹与碳足迹为基本成员的足迹家族模型,引入多个资源环境压力指标,并基于DPSIR框架,运用综合集成法分析确立资源环境可持续性评价指标体系,由随机森林法与层次分析法确定各项指标的组合权重,运用模糊综合评价法分析区域资源环境压力状况与可持续性状况,进而开展了基于三维足迹家族模型的南京市资源环境可持续评价研究。结果表明,2012~2021年南京市水土资源均有占用存量资本,但占用情况整体呈下降趋势,碳足迹处于低压力范围,资源环境可持续性逐年向好;2012~2019年南京市资源环境可持续状况为弱可持续,2020~2021年为强可持续。 展开更多
关键词 三维足迹家族模型 资源环境可持续性评价 DPSIR框架 随机森林-层次分析法组合权重 南京市
下载PDF
基于RSIV-RF模型的凉山州泥石流易发性评价 被引量:1
13
作者 饶姗姗 冷小鹏 《地质科技通报》 CAS CSCD 北大核心 2024年第1期275-287,共13页
针对随机森林(RF)模型进行泥石流易发性评价过程中存在连续型因子依靠主观意识分级、随机选取的非泥石流样本准确度较低等问题,以位于四川西南部的凉山彝族自治州为研究区,提出基于统计学先验模型抽样的随机森林对研究区进行泥石流易发... 针对随机森林(RF)模型进行泥石流易发性评价过程中存在连续型因子依靠主观意识分级、随机选取的非泥石流样本准确度较低等问题,以位于四川西南部的凉山彝族自治州为研究区,提出基于统计学先验模型抽样的随机森林对研究区进行泥石流易发性评价分区。利用累计灾害频率等曲线的相对变化对连续型因子进行分级处理;采用粗糙集理论(RS)和信息量法(IV)计算加权信息量值,划定极低和低易发性区并从中选择负样本数据。通过袋外误差(OOB)变化曲线确定RF模型的最佳树棵数n_estimators和分裂特征数max_features,随后构建加权信息量-随机森林(RSIV-RF)模型预测凉山州泥石流易发性。进一步地,与从全区随机选择非泥石流样本的RF模型开展对比研究。结果表明,训练集和测试集下RSIV-RF模型的准确度分别为0.89,0.83,且对应的ROC曲线的AUC值分别为0.920,0.895,均高于单独的RF模型;RSIV-RF绘制的泥石流易发性评价图与历史灾害分布较为一致,较高和高易发性等级区域占研究区面积比为18.625%,包含了78.57%的泥石流点。性能评估和易发性统计结果均表明基于RSIV-RF能够解决单独模型存在的非泥石样本采样不准确的问题,其泥石流易发性预测精度更高,在凉山州地区泥石流易发性评价研究中具有较好的适应性。 展开更多
关键词 随机森林(RF) 不平衡数据集 加权信息量(RSIV) 泥石流 RSIV-RF模型 凉山州 易发性评价
下载PDF
基于地理加权随机森林的黑龙江省森林碳储量遥感估测
14
作者 卫格冉 李明泽 +3 位作者 全迎 王斌 刘建阳 明烺 《中南林业科技大学学报》 CAS CSCD 北大核心 2024年第7期64-76,共13页
【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导... 【目的】构建地理加权随机森林(Geographically weighted random forest,GWRF)模型估算森林碳储量以解决区域尺度范围内森林碳储量估算精度不高的问题,对科学经营管理森林、推动碳循环和碳汇相关研究、实现我国“双碳”目标有重要指导意义。【方法】以黑龙江省小兴安岭、长白山地区森林植被碳储量为研究对象,基于2015年森林资源连续清查数据和Landsat8-OLI影像,采用普通最小二乘(Ordinary least squares,OLS)、随机森林(Random forest,RF)模型、地理加权回归(Geographically weighted regression,GWR)模型以及地理加权随机森林模型分别构建不同林型及总体(不分林型)的森林碳储量估测模型,比较是否区分林分类型时,不同模型预测精度之间的差异,实现对研究区森林碳储量的精准反演。【结果】1)各个模型在区分林型时的预测精度均高于总体(不分林型)情况,以GWRF模型精度最优,其中针叶林精度最高(R^(2)=0.58,RMSE=15.97 t/hm^(2));阔叶林次之(R^(2)=0.46,RMSE=17.66 t/hm^(2));针阔混交林随后(R^(2)=0.45,RMSE=19.51 t/hm^(2));总体(不分林型)最低(R^(2)=0.40,RMSE=20.22 t/hm^(2))。2)4种模型的检验精度GWRF>RF>GWR>OLS。与OLS相比,GWRF在针叶林、阔叶林、针阔混交林和总体(不分林型)中提升的ΔR^(2)分别为0.15、0.09、0.16和0.04;降低的ΔRMSE分别为2.09、1.35、3.47和0.89 t/hm^(2);与RF相比,GWRF提升的ΔR^(2)分别为针叶林0.14、阔叶林0.06、针阔混交林0.04、总体(不分林型)0.02;降低的ΔRMSE分别为针叶林1.95 t/hm^(2)、阔叶林0.86 t/hm^(2)、针阔混交林0.67 t/hm^(2)、总体(不分林型)0.29 t/hm^(2)。3)研究区森林碳储量密度最高预测值为77.08 t/hm^(2),最低值为5.24 t/hm^(2),平均值为41.07 t/hm^(2),总量为552.04 Tg;从空间上看,森林碳储量高值分布在小兴安岭东南部、张广财岭等地区,呈现斑状不均匀性分布。【结论】相比于其他3种模型,GWRF作为局部模型,考虑到空间异质性,在区域尺度范围内估测森林碳储量有较好的应用前景。区分林分类型能提高预测精度,在今后对森林生物量或碳储量的研究中,应考虑区分林分类型建模。本研究的模型和方法有一定适应性,可为森林资源的快速和精准监测提供方法借鉴。 展开更多
关键词 森林碳储量 地理加权随机森林 地理加权回归 随机森林 遥感估测
下载PDF
产时Ⅱ度及以上会阴裂伤风险预测模型的构建和验证
15
作者 胡寅初 杨明晖 +2 位作者 李燕 付立 陆虹 《护理学杂志》 CSCD 北大核心 2024年第6期32-36,62,共6页
目的 构建产时Ⅱ度及以上会阴裂伤风险预测随机森林算法模型,并初步评价模型的预测性能。方法 采用方便抽样法,选取经阴道分娩的1 366例产妇为研究对象,将其按照7∶3的比例随机分为训练集和验证集。采用LASSO回归分析筛选产时Ⅱ度及以... 目的 构建产时Ⅱ度及以上会阴裂伤风险预测随机森林算法模型,并初步评价模型的预测性能。方法 采用方便抽样法,选取经阴道分娩的1 366例产妇为研究对象,将其按照7∶3的比例随机分为训练集和验证集。采用LASSO回归分析筛选产时Ⅱ度及以上会阴裂伤的风险因素,采用随机森林算法构建预测模型,计算ROC曲线下面积、预测准确率、灵敏度和特异度等评价模型的性能。结果 共计8个预测因子被纳入随机森林模型中,分别为孕前BMI、孕期体质量增加、初产妇、剖宫产史、硬膜外麻醉、催产、引产和胎儿估计体质量,其中胎儿估计体质量对产时Ⅱ度及以上会阴裂伤的影响最大,其次是初产妇和催产。随机森林模型在验证集中的ROC曲线下面积为0.698(95%CI:0.645~0.751),预测准确率为80.0%(95%CI:75.8%~83.8%),灵敏度和特异度分别为50.5%和89.1%。结论 基于随机森林算法构建的产时Ⅱ度及以上会阴裂伤风险预测模型具有一定的预测价值,但预测性能仍有待提高。 展开更多
关键词 阴道分娩 会阴裂伤 初产妇 剖宫产史 催产 胎儿估计体质量 预测模型 随机森林算法
下载PDF
优化随机森林模型的工控网络异常检测
16
作者 宗学军 王润鹏 +1 位作者 何戡 连莲 《沈阳工业大学学报》 CAS 北大核心 2024年第2期197-205,共9页
针对现有Modbus TCP协议的异常检测效率和准确率低的问题,提出了一种基于混合鲸鱼算法优化的随机森林异常检测模型。该模型将柯西变异和自适应动态惯性权重相结合,利用柯西变异算子增加种群多样性,避免算法陷入局部最优;引用自适应动态... 针对现有Modbus TCP协议的异常检测效率和准确率低的问题,提出了一种基于混合鲸鱼算法优化的随机森林异常检测模型。该模型将柯西变异和自适应动态惯性权重相结合,利用柯西变异算子增加种群多样性,避免算法陷入局部最优;引用自适应动态惯性权重因子提高种群的全局搜索能力,使算法的收敛速度加快。仿真实验结果表明,该模型相较于其他分类算法有着更高的准确率和较强的适应性,证明了模型在实际应用中具有较高的检测精度。 展开更多
关键词 工控网络 异常检测 工业协议 鲸鱼算法 随机森林 混沌映射 柯西变异 自适应权重
下载PDF
基于随机森林和组合赋权法的武汉市洪涝灾害风险评估研究
17
作者 吴京戎 蒋翔 《给水排水》 CSCD 北大核心 2024年第7期162-168,174,共8页
开展城市洪涝灾害风险评估工作是防灾减灾的基础和决策手段之一,已成为当前研究的热点和趋势。首先从城市洪涝灾害的概念和形成机制入手,将致灾因子危险性、孕灾环境敏感性、承灾体脆弱性和防灾减灾能力作为一级指标。以年平均降雨量、... 开展城市洪涝灾害风险评估工作是防灾减灾的基础和决策手段之一,已成为当前研究的热点和趋势。首先从城市洪涝灾害的概念和形成机制入手,将致灾因子危险性、孕灾环境敏感性、承灾体脆弱性和防灾减灾能力作为一级指标。以年平均降雨量、水系距离、高程、地形起伏度等14个二级指标为基础,建立风险评估指标体系。采用随机森林算法、层次分析法和熵值法相结合的方法对指标进行排序和赋权,得到各评估指标的组合权重。以武汉市为研究区域,将各指标权重输入到风险评估模型中,在ArcGIS中进行空间分析和栅格计算,得到研究区危险性、敏感性、脆弱性、防灾减灾能力风险区划图以及综合风险等级分布结果。 展开更多
关键词 洪涝灾害 风险评估 ARCGIS 随机森林 组合赋权
下载PDF
基于加权基因共表达网络分析挖掘子痫前期的诊断标志物
18
作者 姚瑞倩 喻东 薛赓 《海军军医大学学报》 CAS CSCD 北大核心 2024年第12期1529-1539,共11页
目的通过生物信息学分析和机器学习模型挖掘公共数据库中的有效信息,识别子痫前期相关的候选基因,以提高子痫前期早期诊断的准确性并为发病机制和诊疗研究提供靶点。方法从基因表达综合数据库中检索子痫前期患者和正常孕妇胎盘组织样本... 目的通过生物信息学分析和机器学习模型挖掘公共数据库中的有效信息,识别子痫前期相关的候选基因,以提高子痫前期早期诊断的准确性并为发病机制和诊疗研究提供靶点。方法从基因表达综合数据库中检索子痫前期患者和正常孕妇胎盘组织样本的RNA-seq数据集,利用生物信息分析工具完成数据下载、质量控制、比对及定量后获得基因表达矩阵。采用DESeq21.38.3工具筛选差异表达基因,通过基因本体和京都基因与基因组百科全书数据库确定富集通路,利用加权基因共表达网络分析(WGCNA)构建共表达网络,利用随机森林算法建立机器学习预测模型。结果4个数据集156例孕妇(70例子痫前期患者、86例正常孕妇)胎盘组织样本共筛选出49个共有差异表达基因,这些基因显著富集在细胞外区域、卵泡刺激素分泌的正向调节通路、激素活性通路及细胞因子-细胞因子受体相互作用等信号通路。通过WGCNA将49个差异表达基因分为7个共表达模块,鉴定出与子痫前期高度相关的关键模块,并筛选出6个候选关键基因,分别为fms相关受体酪氨酸激酶1(FLT1)、冠毛素2(PAPPA2)、蛋白磷酸酶1调节抑制因子亚基1C(PPP1R1C)、肌球蛋白ⅦB(MYO7B)、长基因间非蛋白编码RNA 2009(LINC02009)和抑制素亚基α(INHA)。基于这6个关键基因构建的随机森林模型对子痫前期有较好的预测价值(AUC=0.978)。结论子痫前期可能与激素分泌、免疫反应、血管生成因子、妊娠相关血浆蛋白、抑制素等有关,相关基因或可成为子痫前期诊断的候选标志物。 展开更多
关键词 子痫前期 生物标志物 加权基因共表达网络分析 随机森林模型
下载PDF
数字经济对乡村振兴发展的影响及机制研究 被引量:7
19
作者 张芳山 李露瑶 陈杰 《林业经济》 2024年第3期78-96,共19页
近年来,数字经济的蓬勃发展对乡村振兴发展的影响极大。文章选取2011—2022年中国30个省份的面板数据,采用熵权法和固定效应模型,探究数字经济对乡村振兴发展的影响机制和程度,并创新性地使用随机森林模型,深入考察影响乡村振兴发展的... 近年来,数字经济的蓬勃发展对乡村振兴发展的影响极大。文章选取2011—2022年中国30个省份的面板数据,采用熵权法和固定效应模型,探究数字经济对乡村振兴发展的影响机制和程度,并创新性地使用随机森林模型,深入考察影响乡村振兴发展的数字经济各项指标的重要性。研究发现:(1)数字经济发展对乡村振兴工作具有显著的促进作用,影响效应为0.4100。(2)数字经济对林业大省乡村振兴的促进作用较其他地区更为显著,影响系数为0.5700,说明数字经济在林业经济的应用已取得了显著成效。(3)数字经济影响乡村振兴最重要的因素是企业拥有网站数和信息从业人数,重要性分别为13.62和11.61,农村电商有望成为乡村振兴的新增长极。(4)数字经济对乡村振兴的促进作用有明显的区域异质性,影响系数分别为东部地区0.6450、西部地区0.2560、东北部地区0.2350、中部地区0.1970。文章聚焦于数字经济各个维度指标的重要性比较以及林业经济大省和其他省份的异质性分析,深化了相关研究内容,弥补了现有文献对林业经济大省数字经济研究的不足。基于此提出政策启示:乡村振兴工作中应利用好数字经济这一推手,重点推动农村电子信息制造业和农村电商,推进林业大省和其他地区乡村振兴工作低成本、高质量发展。 展开更多
关键词 数字经济 乡村振兴 熵权法 面板数据计量模型 随机森林模型
下载PDF
耦合地理加权与随机森林的地表温度降尺度
20
作者 母仕林 刘灿 +1 位作者 罗小波 苟永承 《遥感信息》 CSCD 北大核心 2024年第5期111-120,共10页
针对当前主流地理加权地表温度降尺度算法仅考虑地表温度(land surface temperature,LST)与尺度因子间线性或简单非线性关系的问题,提出了一种利用随机森林表征复杂非线性关系并与GWR耦合(geographically weighted random forest model,... 针对当前主流地理加权地表温度降尺度算法仅考虑地表温度(land surface temperature,LST)与尺度因子间线性或简单非线性关系的问题,提出了一种利用随机森林表征复杂非线性关系并与GWR耦合(geographically weighted random forest model,GWRF)的LST降尺度框架。GWRF降尺度框架从反射率、光谱指数、地形因子等多种尺度因子中筛选出最佳因子,利用地理加权随机森林方法建立LST与尺度因子间复杂的局部非线性关系,实现1000 m LST降尺度到100 m。以北京和张掖地区作为实验区,并与地理加权回归、非线性地理加权回归、随机森林回归模型进行比较。研究发现,基于GWRF的降尺度模型在所有研究区均表现良好,均方根误差和平均绝对误差均低于其他模型,并且具有更高的决定系数R 2。 展开更多
关键词 地表温度 地理加权 随机森林 降尺度 非线性
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部