期刊文献+
共找到199篇文章
< 1 2 10 >
每页显示 20 50 100
煤矿井下钻进速度影响因素及其智能预测方法研究
1
作者 戴剑博 王忠宾 +6 位作者 张琰 司垒 魏东 周文博 顾进恒 邹筱瑜 宋雨雨 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第7期209-221,共13页
在煤矿井下钻探领域,钻进速度(DR)是评估钻探作业最有效的指标之一,钻速预测是实现煤矿钻进智能化的前提条件,对于优化钻机钻进参数、降低作业成本、实现安全高效钻探具有重要意义。为此,提出煤矿井下钻进速度影响因素及其智能预测方法... 在煤矿井下钻探领域,钻进速度(DR)是评估钻探作业最有效的指标之一,钻速预测是实现煤矿钻进智能化的前提条件,对于优化钻机钻进参数、降低作业成本、实现安全高效钻探具有重要意义。为此,提出煤矿井下钻进速度影响因素及其智能预测方法研究,探索基于钻压、转速、扭矩以及钻进深度等少量钻机参数采用机器学习算法实现钻进速度精准预测。首先通过实验室微钻试验,深入分析煤岩力学性能、钻压、转速和钻进深度对扭矩、钻进速度影响规律。研究结果显示,在煤矿井下钻进过程中,随着钻进压力增大,钻进速度呈逐渐升高趋势,在较高的转速条件下钻进压力对钻进速度影响更加明显,转速增加有利于提高钻进速度,但转速对硬度较低的煤层钻进速度影响更为显著;然后,根据煤矿井下防冲钻孔现场数据,采用K–近邻(KNN)、支持向量回归(SVR)和随机森林回归(RFR)3种不同的机器学习算法建立钻进速度预测模型,并结合粒子群算法(PSO)对3种模型超参数进行优化,最后对比分析PSO–KNN,PSO–SVR和PSO–RFR三种钻进速度预测模型预测结果。研究结果表明,PSO–RFR模型准确性最好,决定系数R2高达0.963,均方误差MSE仅有29.742,而PSO–SVR模型鲁棒性最好,在对抗攻击后评价指标变化率最小。本文研究有助于实现煤矿井下钻进速度的精准预测,为煤矿井下智能钻进参数优化提供理论支撑。 展开更多
关键词 钻机参数 K–近邻 随机森林回归 支持向量回归 粒子群算法 钻进速度预测
下载PDF
基于随机森林算法和K-means算法的网络攻击识别方法
2
作者 荣文晶 高锐 +2 位作者 赵弘洋 云雷 彭辉 《电子产品可靠性与环境试验》 2024年第1期8-12,共5页
5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网... 5G网络与核电的深度融合能够提升核电厂生产安全管控水平,减少人为事故,促进核电行业安全和经济发展。但由于网络的接入,为核电安全生产带来了一定的安全风险,恶意攻击者会通过向核电5G网络发起攻击进而破坏核电生产。为了解决核电5G网络场景下面临的网络异常和恶意攻击的问题,提出了一种在核电5G网络场景下基于随机森林算法和K-means算法的实时网络异常检测和网络攻击识别方法,对于提高核电网络安全具有重要的意义。 展开更多
关键词 随机森林算法 K-MEANS算法 网络异常检测 网络攻击识别
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
3
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
基于DBSCAN-ML的液压风力发电机故障诊断研究
4
作者 宾世杨 李利强 +1 位作者 程乐 陈浩武 《机床与液压》 北大核心 2024年第14期227-235,共9页
传统风力发电机对于系统故障的解决方案是有限和预先确定的,而具有大量传感器数据的故障预测诊断可以有效预防可能发生的系统故障,从而降低设备维护成本。为此,提出一种基于DBSCAN-ML的风力发电机故障诊断策略。基于密度的应用噪声算法... 传统风力发电机对于系统故障的解决方案是有限和预先确定的,而具有大量传感器数据的故障预测诊断可以有效预防可能发生的系统故障,从而降低设备维护成本。为此,提出一种基于DBSCAN-ML的风力发电机故障诊断策略。基于密度的应用噪声算法空间聚类(DBSCAN)从正常状态数据中分类出异常状态的风力机数据,然后采用决策树和随机森林算法2种机器学习(ML)算法构建预测模型,最后使用K折交叉验证进行测试。通过广西31台风力发电机组数据对此故障诊断方案进行案例验证。结果表明:DBSCAN算法可以有效分离异常状态数据,且决策树预测模型和随机森林模型可以分别获得92.7%和92.1%的准确率,通过数据挖掘和建模可以检测风力发电机组的故障,并可以预测部件的维护需求。 展开更多
关键词 风力发电机 基于密度的应用噪声算法空间聚类(DBSCAN) 机器学习(ML) 决策树 随机森林 K折交叉验证 故障诊断
下载PDF
基于动态集成加权概率RF的门诊量预测
5
作者 樊冲 《智能计算机与应用》 2024年第5期209-214,共6页
医院门诊量本质上是一种具有潜在规律的时间序列,通过对门诊量进行有效分析和预测,可以更加科学、合理地配置医疗资源。针对门诊量波动幅度较大的时间序列预测问题,提出一种基于动态集成加权概率RF的门诊量预测方法。首先选择具有强泛... 医院门诊量本质上是一种具有潜在规律的时间序列,通过对门诊量进行有效分析和预测,可以更加科学、合理地配置医疗资源。针对门诊量波动幅度较大的时间序列预测问题,提出一种基于动态集成加权概率RF的门诊量预测方法。首先选择具有强泛化性的随机森林(Random Forest,RF)作为预测模型;并且采用k近邻-层次聚类算法对RF模型中树的强度进行评估,从中动态选择性能最佳的决策树,提高回归模型的性能;为了提升预测模型的准确率,采用加权概率融合规则代替原始RF模型的求平均数的规则。经过与BP神经网络和RF对比实验结果表明,提出方法可以更加精准地对门诊量进行预测和分析,为医院更好的运营管理提供了重要依据和决策支持。 展开更多
关键词 门诊量 随机森林 k近邻-层次聚类 加权概率融合
下载PDF
基于机器学习算法的服装直播销量预测模型
6
作者 韩铂 李沛 《丝绸》 CAS CSCD 北大核心 2024年第7期109-117,共9页
为了完善直播销量预测的指标体系,提高直播销量预测的准确率,本文对比多种机器学习算法,分析服装直播销量的影响因素并预测服装直播销量。首先,通过文献分析选取直播销量的影响因素,并使用Spearman相关系数结合显著性进行筛选。其次,通... 为了完善直播销量预测的指标体系,提高直播销量预测的准确率,本文对比多种机器学习算法,分析服装直播销量的影响因素并预测服装直播销量。首先,通过文献分析选取直播销量的影响因素,并使用Spearman相关系数结合显著性进行筛选。其次,通过不同机器学习算法建立服装销量预测模型。选用R 2、MAE、RMSE及MAPE为评价指标,采用5折交叉验证的方法,测试各模型性能。研究结果表明:主播粉丝数、主播近30天场均观看人次、主播近30天场均坑产、产品价格、产品讲解时长、产品近30天历史销量、品牌粉丝数、品牌近30天历史销量、折扣这9个因素之间共线性较弱且与直播销量之间的相关性显著,可作为预测模型中的影响因素;预测算法中K近邻算法和随机森林算法的表现较好,R 2均大于0.98,MAPE均在30.5%以内。预测结果可帮助零售商规划库存,调整生产计划,为产品采购、定价、推广提供数据支持。 展开更多
关键词 直播销量预测 机器学习 随机森林 K近邻 SVM支持向量机 五折交叉验证
下载PDF
基于改进孤立森林算法的交通流异常数据检测模型
7
作者 宫晓婞 董培信 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期61-69,90,共10页
针对交通流异常数据实时检测问题,提出一种基于改进孤立森林算法与K-Means++算法相结合的交通流异常数据检测模型。首先,使用交通流量和交通流速度数据构建交通流序列;然后,利用改进孤立森林算法,构建交通流数据的异常评分模型,并通过K-... 针对交通流异常数据实时检测问题,提出一种基于改进孤立森林算法与K-Means++算法相结合的交通流异常数据检测模型。首先,使用交通流量和交通流速度数据构建交通流序列;然后,利用改进孤立森林算法,构建交通流数据的异常评分模型,并通过K-Means++算法构建滑动窗口计算出异常评分的阈值,以此来实现对交通流数据异常值的实时检测;最后,通过实例分析验证模型的合理性和可行性。研究结果表明:改进孤立森林算法与K-Means++结合的方法可以准确地确定异常评分的阈值进而检测出异常数据;该模型与仅考虑交通流流量的模型、传统孤立森林模型相比,AUC分别高出29.7%和5.3%,与其他常用的LOF、ABOD、OCSVM方法相比,AUC均有所提高。该模型准确率明显提升,在交通流异常数据检测中具有更好的适用性,能够为交通管理部门提供交通状况检测支持,提高交通管理效率。 展开更多
关键词 交通工程 异常检测模型 改进孤立森林算法 交通流数据 K-Means++算法
下载PDF
The Early Warning Signs of a Stroke: An Approach Using Machine Learning Predictions
8
作者 Esraa H. Augi Almabruk Sultan 《Journal of Computer and Communications》 2024年第6期59-71,共13页
Early stroke prediction is vital to prevent damage. A stroke happens when the blood flow to the brain is disrupted by a clot or bleeding, resulting in brain death or injury. However, early diagnosis and treatment redu... Early stroke prediction is vital to prevent damage. A stroke happens when the blood flow to the brain is disrupted by a clot or bleeding, resulting in brain death or injury. However, early diagnosis and treatment reduce long-term needs and lower health costs. We aim for this research to be a machine-learning method for forecasting early warning signs of stroke. The methodology we employed feature selection techniques and multiple algorithms. Utilizing the XGboost Algorithm, the research findings indicate that their proposed model achieved an accuracy rate of 96.45%. This research shows that machine learning can effectively predict early warning signs of stroke, which can help reduce long-term treatment and rehabilitation needs and lower health costs. 展开更多
关键词 Machine Learning STROKE k-Nearest Neighbors Decision Tree Random Forest GXboost
下载PDF
基于RF-SA-SDCNN的涡扇发动机剩余寿命预测
9
作者 肖亮 曾云 《农业装备与车辆工程》 2024年第3期153-158,共6页
针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算... 针对涡扇发动机现阶段预测精确度低的问题,提出了一种基于RF-SA-SDCNN相融合的涡扇发动机剩余寿命预测方法。首先,将多传感器长序列数据进行指数平滑和归一化处理,以减少由于量纲、取值范围不同和噪声波动引起的误差,并利用随机森林算法对多元传感器信号进行重要性特征提取;然后,搭建基于随机森林算法和自注意机制与堆叠膨胀卷积神经网络相结合的预测模型,自注意机制通过对特征赋予不同权重分配加强贡献度,堆叠膨胀卷积通过扩大模型感受野提取时序特征用于回归分析,并利用GridSearch优化算法和StratifiedKFold交叉验证方法优化模型提升模型预测精度;最后,采用CMAPSS数据集验证验证所提方法的有效性。结果表明,所提方法可有效提高涡扇发动机剩余寿命预测精度。 展开更多
关键词 随机森林算法 自注意机制 堆叠神经网络 GridSearch K折交叉验证 指数平滑
下载PDF
随机森林法在母型船选型中的应用研究 被引量:1
10
作者 张明霞 赵桐鸣 王思沂 《应用科技》 CAS 2023年第5期126-132,174,共8页
船型技术经济论证中首先需要选择合适的母型船作为初始方案,在此基础上进行船型变换及优选。如何快速地从大量实船方案中筛选出最接近设计方案的船型,是技术经济论证工作智能化不可回避的问题。文中以油轮为例,收集了617艘船舶主尺度等... 船型技术经济论证中首先需要选择合适的母型船作为初始方案,在此基础上进行船型变换及优选。如何快速地从大量实船方案中筛选出最接近设计方案的船型,是技术经济论证工作智能化不可回避的问题。文中以油轮为例,收集了617艘船舶主尺度等相关要素,建立实船案例库;采用随机森林加权算法获取特征属性的权重,检索出与目标方案最近的方案作为母型船;为验证有效性,与普通权重法、熵权法及层次分析法–熵权法的组合权重法进行比较。结果表明,基于随机森林加权的最近邻算法平均准确率最大值高1%~2%,平均宏观f1分数最大值高1%~6%,检索出的方案与目标方案相似度最高。随机森林法的准确度高,实现了母型船案例检索的智能化与自动化。 展开更多
关键词 母型船检索 智能化 知识工程 基于案例推理 K最近邻算法 随机森林算法 组合赋权法 分类性能评估
下载PDF
融合分数阶微分与PIMP-RF算法的集成学习模型预测成熟期苹果可溶性固形物含量
11
作者 黄华 刘亚 +5 位作者 库尔班古丽·都力昆 曾繁琳 玛依热·麦麦提 阿瓦古丽·麦麦提 买地努尔汗·艾则孜 郭俊先 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第10期3059-3066,共8页
可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC... 可溶性固形物含量(SSC)是反映苹果品质和成熟度的重要生理指标,能够用于苹果品质分析和成熟度预测。以新疆阿克苏冰糖心红富士苹果为研究对象,从果实膨大定形期至完熟期,以等间隔周期3 d采摘样本,测其380~1100 nm的可见/近红外光谱和SSC,共552个样本。然后融合分数阶微分(FD)及置换重要性-随机森林(PIMP-RF)算法,构建成熟期苹果SSC预测的集成学习模型。结果表明,基于PLS模型优选的分数阶微分阶次为0阶、0.4阶、1.1阶和1.6阶,且通过PIMP-RF算法进行特征重要性和可解释性分析结果显示,利用可见/近红外光谱预测成熟期苹果SSC的关键波长主要为可见光波段,这为今后研发新疆冰糖心红富士苹果的快速无损检测设备提供参考;基于分数阶微分技术和PIMP-RF算法构建的成熟期苹果SSC集成学习模型具有很好的预测能力,其训练集的相关系数r等于0.9892,平均绝对误差MAE等于0.2412,均方根误差RMSE等于0.3091,平均绝对百分误差等于0.0183;测试集的相关系数r等于0.9038,平均绝对误差MAE等于0.5499,均方根误差RMSE等于0.7408,平均绝对百分误差等于0.0434,相比于FD0-PIMP-RF、FD0.4-PIMP-RF、FD1.1-PIMP-RF和FD1.6-PIMP-RF模型,集成学习模型为最优。故而,集成分数阶微分技术与PIMP-RF算法,结合可见近红外光谱技术可有效地实现成熟期苹果的可溶性固形物含量预测。 展开更多
关键词 可见/近红外光谱 分数阶微分 置换重要性-随机森林 K近邻(KNN)回归 可溶性固形物含量
下载PDF
基于机器学习的隧道地质勘察岩性识别分析及应用研究
12
作者 程勇 王琛 +3 位作者 刘夏临 刘继国 陈世纪 黄胜 《隧道建设(中英文)》 CSCD 北大核心 2023年第9期1549-1557,共9页
为提高水平定向钻勘察中岩性识别的效率,基于机器学习算法采用钻进参数识别围岩岩性。以新疆某隧道工程为例,通过对水平定向钻的工作原理进行分析,采用钻进速度、校正后的钻孔底部压强、泥浆压力和进浆流量作为输入特征预测围岩岩性。对... 为提高水平定向钻勘察中岩性识别的效率,基于机器学习算法采用钻进参数识别围岩岩性。以新疆某隧道工程为例,通过对水平定向钻的工作原理进行分析,采用钻进速度、校正后的钻孔底部压强、泥浆压力和进浆流量作为输入特征预测围岩岩性。对KNN(k-nearest neighbor)算法和随机森林算法各设置48个超参数,测试集的平均准确率分别为83.28%和93.04%,模型不存在欠拟合和过拟合问题。将五分类问题转化为5个二分类问题,2种算法的准确率、精确率、召回率、F_(1)值基本均在90.00%以上,受试者工作特征(receiver operating characteristic,ROC)曲线中曲线下面积(area under curve,AUC)也接近于1。使用Smote过采样后的KNN算法和随机森林算法都具有良好的鲁棒性和泛化能力,但综合各项评价指标可知,使用随机森林模型预测围岩岩性的效果更佳。 展开更多
关键词 隧道 地质勘察 水平定向钻 岩性识别 KNN算法 随机森林算法 机器学习
下载PDF
改进随机森林模型在人口空间化中的应用 被引量:2
13
作者 江雪梨 熊永良 +3 位作者 郭红梅 赵真 张莹 孟雅湉 《测绘通报》 CSCD 北大核心 2023年第6期155-160,共6页
基于随机森林模型的人口空间化方法未考虑人口空间分布非平衡性,利用Bootstrap采样加剧样本的不均衡性,使其不具有代表性,造成模型预测精度较低。针对此问题,本文以成都市为例,通过相关性分析提取影响人口分布的特征因子,基于K-means++... 基于随机森林模型的人口空间化方法未考虑人口空间分布非平衡性,利用Bootstrap采样加剧样本的不均衡性,使其不具有代表性,造成模型预测精度较低。针对此问题,本文以成都市为例,通过相关性分析提取影响人口分布的特征因子,基于K-means++聚类算法对数据集进行聚类处理,然后利用Bootstrap采样法从各簇中抽取等量的数据融合作为训练子集构建改进随机森林模型,并与传统随机森林模型进行对比。运用改进后的随机森林模型对成都市2020年人口数据进行空间化,并与WorldPop数据集进行精度对比。结果表明,基于改进随机森林的人口空间化模型整体精度达80.5%,较改进前提高了约3.4%,有效提高了模型预测精度;相较于WorldPop数据集,基于改进随机森林模型的人口空间化结果在拟合度及精度方面均较优。 展开更多
关键词 人口空间化 随机森林 K-means++聚类 成都市
下载PDF
基于分类算法的汽轮机故障诊断 被引量:1
14
作者 杨荣利 曹军 +1 位作者 张延启 周东阳 《电子设计工程》 2023年第9期68-72,共5页
汽轮机系统设备是火电厂的主力运行设备之一,对汽轮机系统进行有效的故障诊断及预测有助于保障火电机组的安全、稳定运行。基于随机森林算法对汽轮机数据进行处理,完成对汽轮机设备原始数据信息的降维与特征筛选。同时采用6种分类算法... 汽轮机系统设备是火电厂的主力运行设备之一,对汽轮机系统进行有效的故障诊断及预测有助于保障火电机组的安全、稳定运行。基于随机森林算法对汽轮机数据进行处理,完成对汽轮机设备原始数据信息的降维与特征筛选。同时采用6种分类算法建立汽轮机正常和故障的算法模型,实现汽轮机设备状态正常、异常的故障诊断。在汽轮机含有故障的真实运行数据集上进行的实验结果表明,预测准确率较高的模型依次为梯度提升决策树、随机森林、决策树以及K近邻分类算法,且准确率最高可达99.98%;而预测用时较短的模型为K近邻和决策树分类算法,对20 000余条样本训练进行预测,最快可在0.034 s内完成。 展开更多
关键词 汽轮机 故障诊断 分类算法 随机森林 K近邻
下载PDF
基于fNIRS和ECG的大脑警觉度客观检测研究 被引量:1
15
作者 王璐琪 姜劲 +4 位作者 孙子恒 代艳莹 曹勇 焦学军 周鹏 《载人航天》 CSCD 北大核心 2023年第2期177-185,共9页
航天员执行操纵和维护设备等任务时需保持高警觉状态,以便应对突发情况,保护自身安全。针对目前警觉度检测尚无统一标准,单生理参数检测法可靠性差的问题,利用多模态参数检测法,采用PVT任务与2-back任务组合诱导警觉度降低,通过功能性... 航天员执行操纵和维护设备等任务时需保持高警觉状态,以便应对突发情况,保护自身安全。针对目前警觉度检测尚无统一标准,单生理参数检测法可靠性差的问题,利用多模态参数检测法,采用PVT任务与2-back任务组合诱导警觉度降低,通过功能性近红外光谱技术(fNIRS)和心电技术(ECG)采集14名被试前额部分的氧合血红蛋白(HbO)信号、脱氧血红蛋白(Hb)信号以及ECG信号,并记录被试的行为学数据。结果表明:此实验范式成功诱导警觉度下降,在低警觉度状态下大脑代谢水平增加,复杂度增加,大脑前额区活跃度增加;心率降低,副交感神经活性增强。二者特征相结合增大了警觉度识别三分类准确度。在支持向量机模型下,14名被试的平均三分类正确率达到(80.37±5.76)%,较之前文献报道的正确率有所提升。验证了此特征模型检测警觉度水平的有效性及使用混合特征矩阵提高警觉度模型的鲁棒性。 展开更多
关键词 功能性近红外光谱 心电 警觉度 支持向量机 K近邻检测法 随机森林
下载PDF
基于随机森林和树突网络的煤镜质组反射率估计 被引量:1
16
作者 袁懿琳 赵荣焕 +3 位作者 何坤 黄秀 王洪栋 邹亮 《工矿自动化》 CSCD 北大核心 2023年第8期148-155,共8页
镜质组平均最大反射率是表征煤化程度的重要指标,在确定煤级、鉴别混煤和指导炼焦配煤中起关键作用。传统反射率测定方法费时耗力,且测量结果的主观性较强,致使实验室间鉴定结果的可比性差。针对该问题,提出一种基于随机森林(RF)和树突... 镜质组平均最大反射率是表征煤化程度的重要指标,在确定煤级、鉴别混煤和指导炼焦配煤中起关键作用。传统反射率测定方法费时耗力,且测量结果的主观性较强,致使实验室间鉴定结果的可比性差。针对该问题,提出一种基于随机森林(RF)和树突网络(DDNet)的煤镜质组反射率估计方法,主要包括煤岩显微图像分割、镜质组识别和镜质组平均最大反射率预测3个部分。利用手肘法和K-Means算法对显微图像聚类,以实现不同显微组分区域的分割;采用人工少数类过采样法(SMOTE)对少数类样本过采样,以改善煤岩中镜质组与非镜质组区域样本的不均衡问题;利用基于DDNet的回归算法实现镜质组平均最大反射率的估计,构建回归模型时从镜质组区域中选择多个41×41像素的方形窗口并提取其灰度特征,以提高算法的鲁棒性,其决定系数达到0.990。实验结果表明:采用手肘法自动确定K-Means算法的参数K,具有良好的自适应能力,能够自动区分不同类别数的显微组分;SMOTE方法可有效避免模型因过度学习样本先验信息而导致对多数类识别好、少数类识别差的问题,提高分类准确度,其中基于RF的识别模型准确率达到97.0%;建立了7种回归估计模型,其中DDNet回归模型性能最佳,决定系数达到0.990,预测结果与实际值高度契合,验证了所提方法的可行性。 展开更多
关键词 镜质组平均最大反射率 K-MEANS聚类 随机森林 树突网络 SMOTE DDNet回归算法
下载PDF
不同缺失比例下的缺失值插补方法比较
17
作者 单锐 杨婧 +1 位作者 朱文元 王芳 《信息技术》 2023年第12期52-56,共5页
现实中获得的数据集往往存在缺失值,为了研究不同缺失值插补方法在不同缺失比例下的插补效果,文中选择数值型和混合型的完整数据集,设置不同的缺失比例,分别使用均值插补、K近邻插补、多变量特征插补、随机森林插补四种方法对其进行插补... 现实中获得的数据集往往存在缺失值,为了研究不同缺失值插补方法在不同缺失比例下的插补效果,文中选择数值型和混合型的完整数据集,设置不同的缺失比例,分别使用均值插补、K近邻插补、多变量特征插补、随机森林插补四种方法对其进行插补,并使用决策树分类器拟合填补后的数据集,通过计算分类精度比较四种方法的填补效果。实验结果表明,在缺失比例不大于50%时,多变量特征插补和随机森林插补方法在数值型和混合型数据集上的插补效果优于其他两种方法。 展开更多
关键词 数据缺失 均值插补 K近邻插补 多变量特征插补 随机森林插补
下载PDF
基于机器学习的太湖流域多层次防洪调度方案综合评价 被引量:5
18
作者 高玮志 高华勇 +1 位作者 王兆礼 赖成光 《水资源保护》 EI CAS CSCD 北大核心 2023年第3期118-125,236,共9页
为解决太湖流域多层次防洪调度方案在不同防洪层次目标下的评价问题,构建了流域、区域、城镇多层次防洪排涝调度方案综合评价指标体系,并基于K近邻(KNN)和随机森林(RF)算法构建调度方案综合评价模型。结果表明,联合KNN模型和RF模型实现... 为解决太湖流域多层次防洪调度方案在不同防洪层次目标下的评价问题,构建了流域、区域、城镇多层次防洪排涝调度方案综合评价指标体系,并基于K近邻(KNN)和随机森林(RF)算法构建调度方案综合评价模型。结果表明,联合KNN模型和RF模型实现了KNN-RF组合模型评价,其针对流域、区域与城镇3个层次防洪目标进行调度方案评价的平均相对误差和平均绝对误差分别降低至1.25%、0.82%、2.43%和0.511、0.342、1.380,最大相对误差和最大绝对误差得到改善,等级划分总体正确率高于95%;KNN-RF组合模型能筛选出各层次防洪目标下较优的调度方案,减少单一算法不确定性导致的异常评价误差,评价精度显著提高。 展开更多
关键词 多层次防洪调度方案 K近邻算法 随机森林算法 KNN-RF组合模型 太湖流域
下载PDF
不同缺失率下的数据填补算法稳定性研究 被引量:5
19
作者 郑智泉 陈妍 +1 位作者 王孟孟 田维琦 《统计与决策》 北大核心 2023年第8期12-17,共6页
为了研究数据缺失填补算法的准确性和稳定性,文章基于完全随机缺失对完整数据集按不同缺失率进行挖空处理,然后使用6种算法对缺失数据进行填补,并重复执行多次,对比分析其准确性和稳定性,给出相应的置信区间。结果表明,混合迭代填补法... 为了研究数据缺失填补算法的准确性和稳定性,文章基于完全随机缺失对完整数据集按不同缺失率进行挖空处理,然后使用6种算法对缺失数据进行填补,并重复执行多次,对比分析其准确性和稳定性,给出相应的置信区间。结果表明,混合迭代填补法准确性优于K近邻、缺失森林、加权K近邻等算法,其稳定性仅次于缺失森林;随着缺失率的增大,该算法准确性高的优势更加显著;当缺失率小于5%时,该算法的准确性和稳定性达到最佳。 展开更多
关键词 数据缺失 缺失率 K近邻 缺失森林 混合迭代填补
下载PDF
基于随机森林的地质灾害潜在财产损失空间预测——以西藏昌都为例
20
作者 支泽民 刘峰贵 +2 位作者 陈琼 夏兴生 周强 《高原科学研究》 CSCD 2023年第2期21-30,共10页
作为受地质灾害影响最为严重的国家之一,地质灾害每年给中国造成严重的经济损失。作为灾后应急响应与灾情评估的重要依据,快速精准的灾害损失评估就变的极为重要。文章以西藏自治区昌都市为研究区,选取地质灾害隐患点以及土地利用等数据... 作为受地质灾害影响最为严重的国家之一,地质灾害每年给中国造成严重的经济损失。作为灾后应急响应与灾情评估的重要依据,快速精准的灾害损失评估就变的极为重要。文章以西藏自治区昌都市为研究区,选取地质灾害隐患点以及土地利用等数据,基于ArcGIS对昌都市地质灾害空间分布特征进行分析,基于随机森林回归方程构建了昌都市地质灾害潜在财产损失评估模型,对昌都市的潜在财产损失进行评估。研究发现:(1)昌都市的高山峡谷区地质灾害隐患在水平空间分布上具有明显的沿河流与道路分布的集聚特征;在垂直空间分布上,不同灾害类型的占比具有明显差异;(2)从经济损失来看,地质灾害主要对道路威胁较大,其次是居民建筑、耕地与林地。同时,基于实际地质灾害隐患数据构建的潜在财产损失评估模型能够为区域地质灾害损失快速评估提供有效的参考,为同类型区域地质灾害损失的快速评估提供一种具有参考价值的定量评估方法。 展开更多
关键词 地质灾害 昌都市 财产损失 随机森林 Ripley′s K函数
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部