期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
基于IBOA-ERF的风力发电机齿轮箱故障检测
1
作者 刘国旭 周广凯 赵竞一 《沈阳工程学院学报(自然科学版)》 2024年第2期15-25,37,共12页
针对风力发电机齿轮箱故障检测模型参数优化难度大的问题,提出一种基于改进的蝶形优化算法的极端随机森林故障检测模型。将故障检测模型虚警率与漏警率的代数和构造为适应度函数,改进个体初始位置和位置更新策略。引入混沌映射策略代替... 针对风力发电机齿轮箱故障检测模型参数优化难度大的问题,提出一种基于改进的蝶形优化算法的极端随机森林故障检测模型。将故障检测模型虚警率与漏警率的代数和构造为适应度函数,改进个体初始位置和位置更新策略。引入混沌映射策略代替原有的种群初始化方法,增强初始种群分布的随机性。提出一种自适应惯性权重因子,结合鸽群优化算法的地标算子更新种群位置迭代方程,加快收敛速度,提高蝴蝶优化算法的多样性和鲁棒性。采用局部搜索阶段和全局搜索阶段的动态切换方法,实现全局搜索与局部搜索的动态平衡,避免陷入局部最优。建立极端随机森林故障检测模型,利用改进的蝶形优化算法获取最优参数,实现所提模型在高维数据下具有良好的鲁棒性和泛化性的快速响应。与其他优化算法相比,所提风力发电机组齿轮箱故障检测方法具有较低的误报率和漏报率。 展开更多
关键词 故障检测 蝴蝶优化算法 极端随机森林 风力发电机 齿轮箱
下载PDF
Power Transformer Fault Diagnosis Using Random Forest and Optimized Kernel Extreme Learning Machine 被引量:1
2
作者 Tusongjiang Kari Zhiyang He +3 位作者 Aisikaer Rouzi Ziwei Zhang Xiaojing Ma Lin Du 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期691-705,共15页
Power transformer is one of the most crucial devices in power grid.It is significant to determine incipient faults of power transformers fast and accurately.Input features play critical roles in fault diagnosis accura... Power transformer is one of the most crucial devices in power grid.It is significant to determine incipient faults of power transformers fast and accurately.Input features play critical roles in fault diagnosis accuracy.In order to further improve the fault diagnosis performance of power trans-formers,a random forest feature selection method coupled with optimized kernel extreme learning machine is presented in this study.Firstly,the random forest feature selection approach is adopted to rank 42 related input features derived from gas concentration,gas ratio and energy-weighted dissolved gas analysis.Afterwards,a kernel extreme learning machine tuned by the Aquila optimization algorithm is implemented to adjust crucial parameters and select the optimal feature subsets.The diagnosis accuracy is used to assess the fault diagnosis capability of concerned feature subsets.Finally,the optimal feature subsets are applied to establish fault diagnosis model.According to the experimental results based on two public datasets and comparison with 5 conventional approaches,it can be seen that the average accuracy of the pro-posed method is up to 94.5%,which is superior to that of other conventional approaches.Fault diagnosis performances verify that the optimum feature subset obtained by the presented method can dramatically improve power transformers fault diagnosis accuracy. 展开更多
关键词 Power transformer fault diagnosis kernel extreme learning machine aquila optimization random forest
下载PDF
Prediction of Alzheimer’s Using Random Forest with Radiomic Features
3
作者 Anuj Singh Raman Kumar Arvind Kumar Tiwari 《Computer Systems Science & Engineering》 SCIE EI 2023年第4期513-530,共18页
Alzheimer’s disease is a non-reversible,non-curable,and progressive neurological disorder that induces the shrinkage and death of a specific neuronal population associated with memory formation and retention.It is a ... Alzheimer’s disease is a non-reversible,non-curable,and progressive neurological disorder that induces the shrinkage and death of a specific neuronal population associated with memory formation and retention.It is a frequently occurring mental illness that occurs in about 60%–80%of cases of dementia.It is usually observed between people in the age group of 60 years and above.Depending upon the severity of symptoms the patients can be categorized in Cognitive Normal(CN),Mild Cognitive Impairment(MCI)and Alzheimer’s Disease(AD).Alzheimer’s disease is the last phase of the disease where the brain is severely damaged,and the patients are not able to live on their own.Radiomics is an approach to extracting a huge number of features from medical images with the help of data characterization algorithms.Here,105 number of radiomic features are extracted and used to predict the alzhimer’s.This paper uses Support Vector Machine,K-Nearest Neighbour,Gaussian Naïve Bayes,eXtreme Gradient Boosting(XGBoost)and Random Forest to predict Alzheimer’s disease.The proposed random forest-based approach with the Radiomic features achieved an accuracy of 85%.This proposed approach also achieved 88%accuracy,88%recall,88%precision and 87%F1-score for AD vs.CN,it achieved 72%accuracy,73%recall,72%precisionand 71%F1-score for AD vs.MCI and it achieved 69%accuracy,69%recall,68%precision and 69%F1-score for MCI vs.CN.The comparative analysis shows that the proposed approach performs better than others approaches. 展开更多
关键词 Alzheimer’s disease radiomic features cognitive normal support vector machine mild cognitive impairment extreme gradient boosting random forest
下载PDF
基于随机森林和XGBoost算法构建心脏骤停患者自主循环恢复后神经功能预后不良的风险预测模型
4
作者 桑珍珍 崔杰 +2 位作者 闫寒 王维峰 庞秀艳 《中国急救医学》 CAS CSCD 2024年第7期577-585,共9页
目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集... 目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集患者临床资料,根据患者转出重症监护病房(ICU)时的格拉斯哥-匹兹堡脑功能表现分级(CPC)评分,将其分为预后良好组(GNO,n=158)和预后不良组(PNO,n=323)。481例患者按7∶3随机分为训练集(n=338)和测试集(n=143),训练集用于构建模型,测试集用评价模型效能。利用极端梯度提升(XGBoost)和随机森林(RF)两种机器学习算法构建患者神经功能预后不良的预测模型,分别得出影响患者神经功能预后的变量,应用SHAP进行XGBoost模型可解释性分析。将XGBoost和RF算法得出的变量取交集,再将交集变量进行多因素Logistic回归分析,得到差异有统计学意义的变量,进而构建决策树模型。在训练集和测试集上利用受试者工作特征(ROC)曲线和曲线下面积(AUC)评估决策树模型的预测性能。结果 通过XGBoost模型得到与神经功能预后不良相关的变量15个,RF模型得到与神经功能预后不良相关的变量14个,两种模型取交集得到11个与神经功能预后不良相关的交集变量[视神经鞘直径(ONSD)变化率、神经元特异性烯醇化酶(NSE)、入ICU第3天ONSD(ONSD day3)、心脏骤停至心肺复苏(CA-CPR)时间、ROSC时间、急性生理学与慢性健康状况评价Ⅱ(APACHEⅡ)评分、血肌酐、白蛋白、住ICU时间、血乳酸及年龄]。将这11个交集变量进行多因素Logistic回归分析,结果显示,PNO组与GNO组ONSD变化率、NSE、ONSD day3、ROSC时间及年龄这5个变量差异有统计学意义(P<0.05)。用这5个重要变量构建决策树模型,得出3个与患者神经功能预后不良最相关的变量(NSE、ROSC时间及ONSD变化率),在训练集上的决策树模型预测CA行CPR后ROSC患者神经功能预后不良的AUC为0.857(95%CI 0.809~0.903,P<0.001),在测试集上的AUC为0.834 (95%CI 0.761~0.906,P<0.001)。结论 基于XGBoost和RF这2种机器学习方法构建的决策树模型能够更准确地评估CA患者ROSC后神经功能的不良预后,且评价指标可能简化为NSE、ROSC时间及ONSD变化率。 展开更多
关键词 心脏骤停 自主循环恢复 神经功能 预测模型 随机森林 极端梯度提升
下载PDF
基于优化随机森林模型的降雨群发滑坡易发性评价——以西秦岭极端降雨事件为例
5
作者 刘帅 王涛 +3 位作者 曹佳文 刘甲美 张帅 辛鹏 《地质通报》 CAS CSCD 北大核心 2024年第6期958-970,共13页
随机森林模型(RF)是在滑坡易发性评价中广泛应用的机器学习模型之一。针对制约随机森林模型评价应用质量的难点问题,以西秦岭山区娘娘坝镇极端降雨诱发的2万余处群发滑坡为例,从滑坡-非滑坡样本筛选方法、影响因子选取、联结方法应用和... 随机森林模型(RF)是在滑坡易发性评价中广泛应用的机器学习模型之一。针对制约随机森林模型评价应用质量的难点问题,以西秦岭山区娘娘坝镇极端降雨诱发的2万余处群发滑坡为例,从滑坡-非滑坡样本筛选方法、影响因子选取、联结方法应用和超参数优化4个方面开展了模型优化及与常规模型评价的对比研究。通过区域滑坡易发性评价和有效性比较可知,2种情形评价均取得理想结果,优化随机森林评价结果AUC(精度曲线下的面积)可达0.877,对比常规评价结果更优,表明该优化方法可以明显提升随机森林模型在区域降雨滑坡评价中的效果和学习效率,可为气候变化背景下极端降雨群发滑坡灾害易发性评估提供参考。 展开更多
关键词 滑坡 易发性 随机森林 极端降雨 西秦岭
下载PDF
基于物候与极端气候信息的耕地土壤有机碳空间分布预测研究
6
作者 周琪清 赵小敏 +1 位作者 郭熙 周洋 《土壤学报》 CAS CSCD 北大核心 2024年第3期648-661,共14页
土壤有机碳(Soil Organic Carbon,SOC)作为陆地生态系统中最大的碳库,在农田土壤质量和作物产量方面发挥着重要作用。准确预测耕地SOC的空间分布对于制定农业管理措施至关重要。在数字土壤制图(Digital Soil Mapping,DSM)框架下,选择有... 土壤有机碳(Soil Organic Carbon,SOC)作为陆地生态系统中最大的碳库,在农田土壤质量和作物产量方面发挥着重要作用。准确预测耕地SOC的空间分布对于制定农业管理措施至关重要。在数字土壤制图(Digital Soil Mapping,DSM)框架下,选择有效的环境协变量是提高SOC空间预测精度的重要方法。以往遥感指数和气候变量通常使用某个时段或时点的(平均)值作为输入变量,而很少有研究将时间特性和事件用于土壤有机碳预测。因此,引入物候变量、极端气候变量弥补部分损失的地物信息和气候特征,探讨其对研究区耕地SOC空间变异的响应特性及预测SOC空间分布的可行性。以江西省上高县为研究区域,采用随机森林模型,选取遥感数据、DEM衍生变量、物候参数、气候特征因子等作为环境协变量引入模型中,并用普通克里格(Ordinary Kriging,OK)对模型结果进行残差修正,最后对比不同类型变量组合下模型的预测效果及预测精度。结果表明,时序变量、物候变量及极端气候变量能够改善模型的预测性能,并且残差作为误差项还能进一步提升模型的精度。结合时序变量、物候变量、极端气候变量、地形变量和残差的组合拥有最高的预测精度,相较于地形变量、遥感变量和气候变量的组合,将R2、MAE和RMSE提升了90.00%、58.95%和57.14%。变量贡献率分析显示,SU、a3和TXx是影响研究区耕地SOC分布的重要变量。因此,物候变量和极端气候变量具有较好的应用前景,未来还需验证极端气候变量作为环境变量在不同土地利用、大尺度研究区下预测土壤属性的有效性。 展开更多
关键词 土壤有机碳 数字土壤制图 随机森林残差克里格 物候 极端气候
下载PDF
基于多中心队列数据的机器学习预测重症感染患儿死亡风险和筛选临床特征的研究
7
作者 朱雪梅 陈申成 +4 位作者 章莹莹 陆国平 叶琪 阮彤 郑英杰 《中国循证儿科杂志》 CSCD 北大核心 2024年第1期31-35,共5页
背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏... 背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏感指标。设计队列研究。方法基于全国20个省级行政区域的54家PICU的儿童多中心感染性疾病协作网数据库,纳入年龄>28天至18岁、确诊感染和至少有1个器官发生功能障碍的患儿,统计122项临床特征信息,以出PICU时死亡/恶化或治愈/好转为结局,通过机器学习构建逻辑回归模型(LR)、随机森林模型(RF)、极端梯度提升树(XGB)和反向传播神经网络(BP),筛选重要的临床特征建立重症感染患儿死亡风险预测模型。主要结局指标模型接收者操作特征曲线下面积(AUROC)和模型筛选临床特征性能的优劣。结果2022年4月1日至2023年12月31日协作网数据库中入PICU时确诊重症感染且入PICU时、入PICU 24 h时和出PICU时临床特征记录均完整的(病例1738例,经过数据预处理包括异常值处理、缺失值填充、强制值区间范围检验、归一化处理)1738条信息进入机器学习构建模型。存活或好转患儿1396例,死亡或恶化患儿342例(19.6%)。队列数据按4∶1分为训练集(1390条)和验证集(348条),训练集中存活或好转1116条,死亡或恶化274条;验证集中存活或好转280条,死亡或恶化68条。在训练集中,共输入模型122个临床特征,经过机器模型学习以及特征筛选后,在50轮的5折分层交叉验证下,验证集LR、RF和XGB的AUROC为0.74~0.78。LR、RF和XGB选择重要性大于均值的临床特征构建最优临床特征,尚无比较好的衡量BP特征重要性的方法,LR模型较RF和XGB构建的最优临床特征较为接近临床预期。结论机器学习预测儿童重症感染性疾病死亡/恶化结局表现一般,预测模型筛选的临床特征与临床预期尚有距离。 展开更多
关键词 机器学习 儿童重症监护室 感染 随机森林模型 极端梯度提升树
下载PDF
荒漠草原区土壤水分ELM-ESTARFM遥感反演模型构建与应用
8
作者 王欢 李瑞平 +3 位作者 王福强 赵建伟 苗存立 籍晓婧 《干旱地区农业研究》 CSCD 北大核心 2024年第3期236-244,共9页
土壤水分的高时空分辨率和高精度评估对干旱监测具有重要意义。为探究我国内蒙古荒漠草原区土壤水分遥感反演最优模型,基于Landsat和MODIS数据进行改进型自适应反射率时空融合(Enhanced Spatial and Temporal Adaptive Reflectance Fusi... 土壤水分的高时空分辨率和高精度评估对干旱监测具有重要意义。为探究我国内蒙古荒漠草原区土壤水分遥感反演最优模型,基于Landsat和MODIS数据进行改进型自适应反射率时空融合(Enhanced Spatial and Temporal Adaptive Reflectance Fusion Model,ESTARFM),结合下垫面因子、地形因子、气象因子、植被因子等多要素环境因子,通过极限学习机(Extreme learning machine,ELM)和随机森林(Random forest,RF)两种方法构建土壤含水率反演模型,并与Landsat(未进行融合)构建的土壤含水率反演模型进行对比,最终筛选得到最优土壤含水率反演模型,并对研究区不同土地利用类型土壤含水率分布特征进行应用分析。结果表明:归一化植被指数是土壤含水率环境因子相关分析中最重要的预测因子(0~10、10~20、20~30 cm土壤深度处R^(2)=0.85、0.82、0.79),其次为降水量(R^(2)=0.73、0.68、0.71)、高程(R^(2)=0.71、0.70、0.71)、水体指数(R^(2)=0.69、0.69、0.68)、归一化盐分指数(R^(2)=0.68、0.67、0.65)。与未进行时空融合所构建的模型相比,利用ESTARFM时空融合所构建的模型精度均有所提升,考虑ESTARFM时空融合时,ELM模型的R^(2)、RMSE、MAE分别为0.89、6.58%、3.93%,RF模型的R^(2)、RMSE、MAE分别为0.78、7.25%、4.95%;未考虑ESTARFM时空融合时,ELM模型的R^(2)、RMSE、MAE分别为0.75、7.37%、5.24%,RF模型的R^(2)、RMSE、MAE分别为0.71、7.48%、5.30%。表明ELM模型比RF模型的土壤含水率反演效果更好,且ELM-ESTARFM为土壤含水率反演最优模型。在此基础上,运用改进后的ELM-ESTARFM遥感反演模型监测了乌审旗全域土壤含水率,发现研究区北部和西北部的土壤含水率较高,南部地区的土壤含水率较低;对于不同土壤深度,土壤含水率由大到小依次为耕地、林地、草地、沙地,耕地区域0~10、10~20、20~30 cm土层含水率分别为18.92%、19.34%、21.84%,林地为11.80%、11.87%、12.40%,草地为10.97%、11.02%、12.22%,沙地为5.07%、5.35%、5.67%。 展开更多
关键词 土壤水分 环境因子 极限学习机 随机森林
下载PDF
基于残差的分布式光伏发电功率组合预测方法 被引量:1
9
作者 吴明朗 庞振江 +4 位作者 洪海敏 占兆武 靳飞 唐远洋 叶璇 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第3期293-302,共10页
分布式光伏发电功率预测在保障电网运行安全和就近消纳方面发挥着重要作用,为提升分布式光伏发电功率预测精度,提出一种基于多元气象的特征提取方法和基于残差连接的多模型融合的光伏发电功率预测模型.在特征提取时,引入统计、交叉、周... 分布式光伏发电功率预测在保障电网运行安全和就近消纳方面发挥着重要作用,为提升分布式光伏发电功率预测精度,提出一种基于多元气象的特征提取方法和基于残差连接的多模型融合的光伏发电功率预测模型.在特征提取时,引入统计、交叉、周期信息、近似熵和光伏板温度等特征提取方法,实现对时间、气象和发电功率的深层特征提取,丰富模型的输入.在模型构建时,建立基于残差连接的多层模型融合方法,首先提出基于k最近邻(k-nearest neighbor,kNN)的softmax回归预测模型,其次设计3层模型整体结构,并通过残差连接和多层堆叠的方式融合多个预测模型,持续提升光伏发电功率预测精度.基于电力公司真实数据,采用本研究方法与随机森林(random forest,RF)、TabNet和极端梯度提升(extreme gradient boosting,XGBoost)等模型,对光伏发电功率进行预测.结果表明,所提模型在均方根误差、平均绝对误差、均方误差和平均绝对百分比误差等方面可分别降低0.1097、0.0591、0.0507和0.0368,拟合优度可提升0.0804.基于多元气象的特征提取方法和基于残差连接的多模型融合的光伏发电功率预测模型能有效提升分布式光伏发电功率预测的精度和稳定性. 展开更多
关键词 人工智能 太阳能 特征提取 残差连接 随机森林 TabNet 极端梯度提升 功率预测
下载PDF
基于逐步多元线性回归和随机森林模型预测黄河流域极端气温事件 被引量:1
10
作者 陈俊清 李毅 +2 位作者 王斌 杨雪宁 刘峰贵 《自然灾害学报》 CSCD 北大核心 2024年第1期74-88,共15页
全球变暖背景下,极端气候事件频发,且对黄河流域等地区的经济发展及人民生活造成严重危害。基于1961—2020年黄河流域80个站点的日气温数据提取了6个逐月极端气温指数(ETI)。利用多重共线性分析去除有相依性的环流指数,并考虑滞后性进行... 全球变暖背景下,极端气候事件频发,且对黄河流域等地区的经济发展及人民生活造成严重危害。基于1961—2020年黄河流域80个站点的日气温数据提取了6个逐月极端气温指数(ETI)。利用多重共线性分析去除有相依性的环流指数,并考虑滞后性进行Pearson相关分析,筛选出各ETI的关键环流指数及最佳滞后时间;之后基于最佳滞后时间下的关键环流指数建立逐步多元线性回归(SMLR)和随机森林(RF)模型。对模型进行精度评价,探究环流指数在单站点及整个流域的重要性,并预测了2022年11月的6个ETI值。结果表明:黄河流域ETI中最高气温(TXx)、暖昼天数(TX90p)、酷热天数(TD30)和最低气温(TNn)呈波动上升趋势,而霜冻天数(FD0)和冷夜天数(TN10p)呈下降趋势;极端高温事件的强度和发生频率的空间分布特征与极端低温事件基本相反。以靖远站TXx为例,各关键环流指数对TXx具有不同程度的影响(0.10<r_(max)<0.89),r_(max)对应的最佳滞后时间主要为5、6、11、12个月。SMLR和RF模型对黄河流域各ETI的预测能力都较好,验证期的决定系数(R 2)范围分别为0.53~0.95和0.64~0.95;除对TXx的模拟效果稍弱外,其他5个ETI的RF模型模拟效果均优于SMLR模型。太平洋区极涡强度指数(PPVI)是影响黄河流域TXx、TNn、TX90p和FD0的最重要环流因子,北非—北大西洋—北美副高脊线位置指数(NANRP)对TN10p和TD30的影响最大。预测的2022年11月ETI的空间分布特征与多年平均情况基本相似。研究结果为黄河流域极端气温事件预报提供了参考。 展开更多
关键词 极端气温指数 环流指数 随机森林模型 逐步多元线性回归模型 黄河流域
下载PDF
随机森林模型预测老年膀胱癌患者术后下肢深静脉血栓发生风险及预警措施
11
作者 崔颖 王以旺 高雪 《西部医学》 2024年第6期861-865,870,共6页
目的探讨随机森林模型预测老年膀胱癌患者术后下肢深静脉血栓(DVT)发生风险及预警措施。方法选取2019年6月—2022年6月我院收治的282例老年膀胱癌患者,按照7∶3比例分为训练组(n=197)和内部验证组(n=85),统计两组下肢DVT发生率及一般临... 目的探讨随机森林模型预测老年膀胱癌患者术后下肢深静脉血栓(DVT)发生风险及预警措施。方法选取2019年6月—2022年6月我院收治的282例老年膀胱癌患者,按照7∶3比例分为训练组(n=197)和内部验证组(n=85),统计两组下肢DVT发生率及一般临床资料,训练组基于随机森林模型结果构建下肢DVT风险预警模型,并行内外部验证。结果282例老年膀胱癌患者下肢DVT发生率为15.10%(42/278)。训练组和内部验证组中,DVT阳性及阴性患者在年龄、BMI、麻醉时间、合并糖尿病、合并高脂血症、术前纤维蛋白原(FIB)、D-二聚体(D-D)、白蛋白(ALB)水平及Caprini风险评估模型(RAM)评分、术后卧床时间比较差异有统计学意义(均P<0.05);确认属性重要性评分前8变量纳入随机森林模型算法中建立下肢DVT风险预警模型,变量重要性评分依次为术前D-D、术前FIB、术前ALB、术前RAM评分、年龄、合并糖尿病、术后卧床时间、合并高脂血症,随机森林模型预测效能为0.933,经外部验证显示模型预测结果与实际结果具有较高一致性。结论随机森林模型对老年膀胱癌患者术后下肢DVT具有较好的预测能力,综合考虑年龄、合并糖尿病、术后卧床时间、合并高脂血症及术前D-D、FIB、ALB与RAM评分等因素有利于预防下肢DVT发生,具有临床指导意义。 展开更多
关键词 膀胱癌 随机森林模型 下肢深静脉血栓 Caprini风险评估模型评分 D-二聚体 纤维蛋白原 白蛋白
下载PDF
基于表层温度深度学习的电缆接头绝缘劣化非接触式诊断
12
作者 严丹昭 陈晶 +1 位作者 兰旺耀 廖一鹏 《红外技术》 CSCD 北大核心 2024年第6期712-721,共10页
为提升电缆中间接头绝缘层劣化程度的现场诊断效率和准确度,提出一种基于表层温度自适应深度学习的接头绝缘劣化状态非接触式诊断方法。首先,对电缆接头及两端电缆的绝缘表层进行红外热成像,实现电缆接头中心两边多个对称区域的表层温... 为提升电缆中间接头绝缘层劣化程度的现场诊断效率和准确度,提出一种基于表层温度自适应深度学习的接头绝缘劣化状态非接触式诊断方法。首先,对电缆接头及两端电缆的绝缘表层进行红外热成像,实现电缆接头中心两边多个对称区域的表层温度、接头两端电缆的表层温度的非接触式采集;其次,构建基于双隐层自编码极限学习机的深度学习网络,以挖掘表层温度数据内部深层次隐含特征,将提取的深度隐含特征作为随机森林诊断模型输入;然后,提出一种非线性动态自适应旋转角的量子旋转门以改进量子烟花算法的更新策略,并用于诊断模型参数优化;最后,结合接头表层红外温度和绝缘介质损耗角正切值构建数据集,对诊断模型进行训练和现场测试。实验结果表明,改进后的量子烟花算法可以较好地逼近全局最优解、收敛效率高,深度学习随机森林诊断模型具有较强的特征抽取和分类能力,参数优化后诊断模型的分类精度和稳定性得到有效提高,在小样本训练集条件下就能达到较好的诊断效果,可实现接头绝缘劣化状态的非接触式诊断。 展开更多
关键词 电缆中间接头 红外测温 绝缘劣化诊断 双隐层自编码极限学习机 随机森林 量子烟花算法
下载PDF
基于机器学习的KRAS抑制剂活性预测模型研究
13
作者 杜克 荣丹琪 +2 位作者 卢瑞 张小雅 赵鸿萍 《中国药科大学学报》 CAS CSCD 北大核心 2024年第3期306-315,共10页
Kirsten大鼠肉瘤病毒癌基因同系物(Kirsten rat sarcoma viral oncogene homolog,KRAS)基因是最常见的突变癌基因之一,发现KRAS抑制剂对存在该基因突变的癌症患者具有潜在的治疗作用。本研究将机器学习应用于KRAS抑制剂的定量构效关系(q... Kirsten大鼠肉瘤病毒癌基因同系物(Kirsten rat sarcoma viral oncogene homolog,KRAS)基因是最常见的突变癌基因之一,发现KRAS抑制剂对存在该基因突变的癌症患者具有潜在的治疗作用。本研究将机器学习应用于KRAS抑制剂的定量构效关系(quantitative structure-activity relationship,QSAR)模型,从ChEMBL、BindingDB、PubChem 3个数据库中收集了1857条KRAS小分子抑制剂的IC50和SMILES(simplified molecular input line entry system),采用3种不同的特征筛选方式结合随机森林、支持向量机、极端梯度提升机3种机器学习模型,构建了9个不同的分类器。结果表明,SVM模型结合互信息筛选显示出最佳性能:AUC_(test)=0.912,ACC_(test)=0.859,F1_(test)=0.890,并且在外部验证集上也表现出良好的预测性能(AUC_(Ext)=0.944,Recall_(Ext)=0.856,FPR_(Ext)=0.111)。该研究为使用人工智能方法在天然产物数据库中进行KRAS抑制剂筛选提供了新的技术路线。 展开更多
关键词 KRAS抑制剂 互信息 主成分分析 随机森林 支持向量机 极端梯度提升机
下载PDF
采用改进被囊群算法的多冷水机组负荷分配优化
14
作者 王华秋 秦思危 《计算机测量与控制》 2024年第2期189-197,共9页
为了降低中央空调系统的运行能耗,针对多冷水机组负荷分配优化问题,提出一种随机森林特征优选结合核函数极限学习机的冷水机组能效预测模型,通过剔除冗余特征提高预测精度;然后提出一种混合策略改进的被囊群算法,融合鲸鱼螺旋搜索策略... 为了降低中央空调系统的运行能耗,针对多冷水机组负荷分配优化问题,提出一种随机森林特征优选结合核函数极限学习机的冷水机组能效预测模型,通过剔除冗余特征提高预测精度;然后提出一种混合策略改进的被囊群算法,融合鲸鱼螺旋搜索策略改进个体更新方式,引入非线性动态权重平衡全局探索和局部开发,使用空翻扰动策略避免陷入局部最优;最后在能效模型的基础上,采用改进被囊群算法对多冷水机组负荷分配进行优化;实验结果表明,随机森林特征优选的方法可以有效地提高能效预测模型的准确度;改进被囊群算法通过优化机组的启停状态和负荷率可以有效发挥系统的节能潜力,与原有方法相比能耗降低约6%;说明该方法适用于多冷水机组的负荷分配优化问题。 展开更多
关键词 被囊群算法 负荷分配 多冷水机组 极限学习机 随机森林
下载PDF
基于Stacking集成学习的恶意攻击检测方法
15
作者 左胜勇 冯立超 +1 位作者 陈学斌 郭宸良 《华北理工大学学报(自然科学版)》 CAS 2024年第3期104-111,共8页
伴随着互联网的快速发展,网络安全问题越发严峻,尤其是网络攻击变得更加频繁,对其检测防控迫在眉睫。该研究主要提出了一种新的LightGBM-XGboost-Random forest的Stacking集成学习模型;新的特征提取方法也被相应提出,通过探索性数据分... 伴随着互联网的快速发展,网络安全问题越发严峻,尤其是网络攻击变得更加频繁,对其检测防控迫在眉睫。该研究主要提出了一种新的LightGBM-XGboost-Random forest的Stacking集成学习模型;新的特征提取方法也被相应提出,通过探索性数据分析对特征集进行重要特征提取,较传统方法更快速、方便;相比于单一模型与传统模型,该Stacking集成学习模型的检测精确度更高,对LUFlows数据集进行实践训练,该集成模型检测精确度可达到97.0%,明显高于单一使用LightGBM模型、XGboost模型、Random forest模型的精确度;同时引入NSL-KDD数据集对该Stacking集成学习模型进行泛化能力测试,与最新的研究进行比对,LXR模型测得F1-score为0.8709,优于多数模型结果。表明该集成学习模型能够提供一种更为精确有效且泛化能力强的网络攻击检测方法,以更好地维护网络空间安全。 展开更多
关键词 轻量化梯度提升 极端梯度提升 随机森林
下载PDF
Prediction of undrained shear strength using extreme gradient boosting and random forest based on Bayesian optimization 被引量:50
16
作者 Wengang Zhang Chongzhi Wu +2 位作者 Haiyi Zhong Yongqin Li Lin Wang 《Geoscience Frontiers》 SCIE CAS CSCD 2021年第1期469-477,共9页
Accurate assessment of undrained shear strength(USS)for soft sensitive clays is a great concern in geotechnical engineering practice.This study applies novel data-driven extreme gradient boosting(XGBoost)and random fo... Accurate assessment of undrained shear strength(USS)for soft sensitive clays is a great concern in geotechnical engineering practice.This study applies novel data-driven extreme gradient boosting(XGBoost)and random forest(RF)ensemble learning methods for capturing the relationships between the USS and various basic soil parameters.Based on the soil data sets from TC304 database,a general approach is developed to predict the USS of soft clays using the two machine learning methods above,where five feature variables including the preconsolidation stress(PS),vertical effective stress(VES),liquid limit(LL),plastic limit(PL)and natural water content(W)are adopted.To reduce the dependence on the rule of thumb and inefficient brute-force search,the Bayesian optimization method is applied to determine the appropriate model hyper-parameters of both XGBoost and RF.The developed models are comprehensively compared with three comparison machine learning methods and two transformation models with respect to predictive accuracy and robustness under 5-fold cross-validation(CV).It is shown that XGBoost-based and RF-based methods outperform these approaches.Besides,the XGBoostbased model provides feature importance ranks,which makes it a promising tool in the prediction of geotechnical parameters and enhances the interpretability of model. 展开更多
关键词 Undrained shear strength Extreme gradient boosting random forest Bayesian optimization k-fold CV
下载PDF
Machine learning-based estimates of aboveground biomass of subalpine forests using Landsat 8 OLI and Sentinel-2B images in the Jiuzhaigou National Nature Reserve,Eastern Tibet Plateau 被引量:2
17
作者 Ke Luo Yufeng Wei +8 位作者 Jie Du Liang Liu Xinrui Luo Yuehong Shi Xiangjun Pei Ningfei Lei Ci Song Jingji Li Xiaolu Tang 《Journal of Forestry Research》 SCIE CAS CSCD 2022年第4期1329-1340,共12页
Accurate estimates of forest aboveground biomass(AGB)are critical for supporting strategies of ecosystem conservation and climate change mitigation.The Jiuzhaigou National Nature Reserve,located in Eastern Tibet Plate... Accurate estimates of forest aboveground biomass(AGB)are critical for supporting strategies of ecosystem conservation and climate change mitigation.The Jiuzhaigou National Nature Reserve,located in Eastern Tibet Plateau,has rich forest resources on steep slopes and is very sensitive to climate change but plays an important role in the regulation of regional carbon cycles.However,an estimation of AGB of subalpine forests in the Nature Reserve has not been carried out and whether a global biomass model is available has not been determined.To provide this information,Landsat 8 OLI and Sentinel-2B data were combined to estimate subalpine forest AGB using linear regression,and two machine learning approaches–random forest and extreme gradient boosting,with 54 inventory plots.Regardless of forest type,Observed AGB of the Reserve varied from 61.7 to 475.1 Mg hawith an average of 180.6 Mg ha.Results indicate that integrating the Landsat 8 OLI and Sentinel-2B imagery significantly improved model efficiency regardless of modelling approaches.The results highlight a potential way to improve the prediction of forest AGB in mountainous regions.Modelled AGB indicated a strong spatial variability.However,the modelled biomass varied greatly with global biomass products,indicating that global biomass products should be evaluated in regional AGB estimates and more field observations are required,particularly for areas with complex terrain to improve model accuracy. 展开更多
关键词 Aboveground biomass Linear regression random forest Extreme gradient boosting Landsat 8 OLI Sentinel-2B
下载PDF
基于特征优选与改进极限学习机的锂电池SOC估计 被引量:6
18
作者 寇发荣 罗希 +2 位作者 门浩 郭杨娟 杨天祥 《储能科学与技术》 CAS CSCD 北大核心 2023年第4期1234-1243,共10页
为提高数据驱动方法预测荷电状态(state of charge,SOC)的效率与精度,提出一种基于特征优选与改进极限学习机的SOC估计方法。采用公开数据作为训练集,利用随机森林(random forest,RF)算法判定训练集各特征对SOC的影响程度,选择出最优训... 为提高数据驱动方法预测荷电状态(state of charge,SOC)的效率与精度,提出一种基于特征优选与改进极限学习机的SOC估计方法。采用公开数据作为训练集,利用随机森林(random forest,RF)算法判定训练集各特征对SOC的影响程度,选择出最优训练样本,并对优选样本的合理性进行验证;利用极限学习机(extreme learning machine,ELM)对SOC进行预测,针对ELM在预测过程中随机产生的权值及阈值的不稳定性导致SOC估计精度不理想的问题,选取麻雀搜索算法(sparrow search algorithm,SSA)进行参数优化以提高估计精度;随后,通过BJDST工况仿真试验对SSA参数优化的有效性进行验证;在恒流放电与DST工况实验下,分别利用改进极限学习机(SSA-ELM)、ELM、支持向量机(support vector machine,SVM)与BP神经网络(back-propagation neural network,BPNN)对SOC进行预测,结果表明,SSA-ELM算法预测效果最优,预测误差基本保持在1.5%以内,可实现较高精度的SOC预测。 展开更多
关键词 随机森林(RF) 麻雀搜索算法(SSA) 极限学习机(ELM) 特征优选 荷电状态(SOC)
下载PDF
基于遥感数据和机器学习算法的草地地上生物量估算研究 被引量:2
19
作者 王婷 周伟 +1 位作者 肖洁芸 谢利娟 《冰川冻土》 CSCD 北大核心 2023年第2期753-762,共10页
草地生态系统作为自然生态系统的重要组成部分,为畜牧经济发展提供了重要的牧草资源,对调节气候变化和维持生态系统平衡等起着非常重要的作用。草地地上生物量(aboveground biomass,AGB)是草地植被生理状态的重要指标,它的大小体现着草... 草地生态系统作为自然生态系统的重要组成部分,为畜牧经济发展提供了重要的牧草资源,对调节气候变化和维持生态系统平衡等起着非常重要的作用。草地地上生物量(aboveground biomass,AGB)是草地植被生理状态的重要指标,它的大小体现着草地初级生产力水平,是衡量草地生态系统中能量循环和物质流动的重要指标,在陆地生态系统的碳循环中起着重要的作用。近几十年来,伴随畜牧业经济快速发展和全球气候变暖,草地生态系统的稳定性降低,生态环境发生退化,草地地上生物量和固碳能力势必受到影响。大尺度、动态化、高精度的草地地上生物量监测对草地碳储量核算和畜牧业可持续发展具有重要意义,而遥感技术凭借高时空探测能力恰好为其提供了解决思路。机器学习算法凭借其优越性、高效性、稳健和精确性已被广泛应用于各个研究领域,使用机器学习算法快速、准确、大范围监测草地地上生物量是目前的研究热点。因此,构建准确的草地地上生物量估算模型,精确估算草地地上生物量及分析其空间分布特征能够有效地衡量草地生态系统的稳定性和维持草地生态资源的可持续发展利用,为该区域草地资源的可持续利用和科学管理提供依据,对该地区的生态安全保护和畜牧业可持续发展具有重要意义。本研究以青海省兴海县草地为研究区,基于野外实测的草地地上生物量数据,结合高空间分辨率的遥感数据、气候数据、地形数据和土壤数据等,利用随机森林(random forest,RF)和极端梯度提升决策树(extreme gradient boosting,XGBoost)方法构建兴海县草地地上生物量估算模型,采用决定系数R^(2)和均方根误差(Root Mean Square Error,RMSE)两个精度验证指标评价两种草地地上生物量估算模型的精度,实现草地地上生物量高精度模拟和制图,并分析其空间分布格局特征。结果表明:基于XGBoost模型的草地地上生物量估算精度(R^(2)=0.75,RMSE=44.64)高于RF的模拟精度(R^(2)=0.72,RMSE=46.36),并且XGBoost模型估算的草地地上生物量与实测的草地地上生物量值更接近。基于两种机器学习模型估算的草地地上生物量数据制作空间分布图,其空间特征与实测草地地上生物量的空间分布相似,草地地上生物量高值区位于研究区的东部,西部地区草地地上生物量值最低,但是模型模拟能更好地揭示草地地上生物量分布的空间异质性。在空间分布特征上,XGBoost模型估算的草地地上生物量空间变异细节更加详细,尤其在研究区东部。本研究基于两种机器学习算法实现草地地上生物量的高精度(30 m空间分辨率)估算和数字制图,并分析其空间分布格局,可为草地生态环境监测和草地资源可持续利用提供科学依据,对于维持生态系统平衡和预测未来气候变化对草地生态系统的影响具有十分重要的理论和实践意义。 展开更多
关键词 草地生态系统 地上生物量 随机森林 极端梯度提升 空间分布
下载PDF
1982—2015年中国温带不同草地植被枯黄期对极端气候事件的响应 被引量:5
20
作者 袁沫汐 赵林 +1 位作者 李鑫鑫 林爱文 《生态学报》 CAS CSCD 北大核心 2023年第14期6015-6032,共18页
随着极端气候事件频率和强度的增加,植被物候正在发生深刻的变化。然而,植被枯黄期(EGS)对极端气候的响应机制目前尚未厘清,特别是对于干旱半干旱地区的草地而言。因此,聚焦我国温带草地,基于1982—2015年全球监测与模型研究工作组归一... 随着极端气候事件频率和强度的增加,植被物候正在发生深刻的变化。然而,植被枯黄期(EGS)对极端气候的响应机制目前尚未厘清,特别是对于干旱半干旱地区的草地而言。因此,聚焦我国温带草地,基于1982—2015年全球监测与模型研究工作组归一化植被指数(GIMMS NDVI3g)长时间序列数据提取草地物候参数,并分析其时空变化规律;运用随机森林模型等方法探究温带草地EGS对极端气候变化的响应特征。结果表明:(1)全区多年平均EGS主要发生于270—290儒略日(DOY),59.8%的区域呈延迟趋势,其中显著延迟(P<0.05)的区域分布在新疆天山、阿尔泰山一带和准噶尔盆地西部、黄土高原北部、呼伦贝尔高原的西部和东北小兴安岭。(2)EGS与极端气温暖极值(日最低气温的最大值、日最高气温的最大值、暖夜日数、暖昼日数)之间均以广泛的正相关关系为主;相比之下,极端降水事件与EGS之间的关系相对比较复杂,这与各草地类型自身的生理策略和所处环境密切相关。(3)整体而言,持续干旱日数、气温日较差和暖夜日数对全域草地EGS动态变化具有极大的重要性。就不同草地类型而言,温带草甸草原主要受到气温日较差的影响,温带山地草甸和温带沼泽化草甸EGS变化主要受日最高气温的最大值的影响,日最低气温的最大值和暖夜日数分别对温带草丛和温带荒漠草原的影响最大;持续湿润日数和持续干旱日数则分别对生长在水分限制地区的温带盐生草甸和温带典型草原的EGS产生强烈作用。 展开更多
关键词 植被枯黄期 极端气候事件 响应 随机森林模型 温带草地
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部