期刊文献+
共找到1,613篇文章
< 1 2 81 >
每页显示 20 50 100
一种基于改进的XGBoosting算法对婴幼儿奶粉中的脂肪含量的预测模型
1
作者 张文婧 薛河儒 +2 位作者 姜新华 刘江平 黄清 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第5期1464-1471,共8页
婴儿奶粉成分配比中,脂肪有着重要地位。脂肪不仅是婴儿生长发育中的重要成分,同时也为婴儿的生长提供必需的能量,对于婴儿脑发育及神经髓鞘的形成具有重要意义。化学的婴儿奶粉脂肪含量检测如乙醚提取法,方法检测灵敏,但存在破坏样本... 婴儿奶粉成分配比中,脂肪有着重要地位。脂肪不仅是婴儿生长发育中的重要成分,同时也为婴儿的生长提供必需的能量,对于婴儿脑发育及神经髓鞘的形成具有重要意义。化学的婴儿奶粉脂肪含量检测如乙醚提取法,方法检测灵敏,但存在破坏样本和检测周期较长的缺点,因此寻求一种为婴儿奶粉成分的无损检测方法,高光谱成像技术提供了一种可能的途径。以内蒙古地区不同阶段的婴儿奶粉为研究对象,采用多元散射校正(MSC)、标准正态变换(SNV)、平滑滤波算法(Savitzky-Golay)、鲁斯特算法(Roust)等对高光谱数据进行预处理,再利用竞争性自适应重加权算法(CARS)算法从125个特征波长中筛除光谱数据中冗余的波长保留有效波长66个。对极值梯度提升算法(XGBoosting)算法进行了贝叶斯优化(BO),最终构建了基于BO-XGBoosting对婴儿奶粉脂肪含量的预测模型。结果显示,该模型预测效果优于传统的偏最小二乘回归(PLSR)和支持向量回归(SVR)模型,且优于集成算法中Bagging、GrdientBoosting算法。贝叶斯优化极值梯度提升算法BO-XGBoosting模型在测试集实验,得到的决定系数(R^(2))和均方根误差(RMSEP)分别为0.9537和0.5773,比XGBoosting算法的R^(2)和RMSEP分别提高2.91%和降低19.2%。该研究为奶粉中脂肪含量的预测提供了基于BO-XGboosting集成算法的快速无损检测的算法支持和理论依据。 展开更多
关键词 高光谱 贝叶斯优化 xgboosting模型 脂肪含量 无损检测
下载PDF
Early Detection of Alzheimer’s Disease Based on Laplacian Re-Decomposition and XGBoosting
2
作者 Hala Ahmed Hassan Soliman +2 位作者 Shaker El-Sappagh Tamer Abuhmed Mohammed Elmogy 《Computer Systems Science & Engineering》 SCIE EI 2023年第9期2773-2795,共23页
The precise diagnosis of Alzheimer’s disease is critical for patient treatment,especially at the early stage,because awareness of the severity and progression risks lets patients take preventative actions before irre... The precise diagnosis of Alzheimer’s disease is critical for patient treatment,especially at the early stage,because awareness of the severity and progression risks lets patients take preventative actions before irreversible brain damage occurs.It is possible to gain a holistic view of Alzheimer’s disease staging by combining multiple data modalities,known as image fusion.In this paper,the study proposes the early detection of Alzheimer’s disease using different modalities of Alzheimer’s disease brain images.First,the preprocessing was performed on the data.Then,the data augmentation techniques are used to handle overfitting.Also,the skull is removed to lead to good classification.In the second phase,two fusion stages are used:pixel level(early fusion)and feature level(late fusion).We fused magnetic resonance imaging and positron emission tomography images using early fusion(Laplacian Re-Decomposition)and late fusion(Canonical Correlation Analysis).The proposed system used magnetic resonance imaging and positron emission tomography to take advantage of each.Magnetic resonance imaging system’s primary benefits are providing images with excellent spatial resolution and structural information for specific organs.Positron emission tomography images can provide functional information and the metabolisms of particular tissues.This characteristic helps clinicians detect diseases and tumor progression at an early stage.Third,the feature extraction of fused images is extracted using a convolutional neural network.In the case of late fusion,the features are extracted first and then fused.Finally,the proposed system performs XGB to classify Alzheimer’s disease.The system’s performance was evaluated using accuracy,specificity,and sensitivity.All medical data were retrieved in the 2D format of 256×256 pixels.The classifiers were optimized to achieve the final results:for the decision tree,the maximum depth of a tree was 2.The best number of trees for the random forest was 60;for the support vector machine,the maximum depth was 4,and the kernel gamma was 0.01.The system achieved an accuracy of 98.06%,specificity of 94.32%,and sensitivity of 97.02%in the case of early fusion.Also,if the system achieved late fusion,accuracy was 99.22%,specificity was 96.54%,and sensitivity was 99.54%. 展开更多
关键词 Alzheimer’s disease(AD) machine learning(ML) image fusion Laplacian Re-decomposition(LRD) xgboosting
下载PDF
基于XGBoost算法的可恢复耕地宜耕性评价——以湘阴县为例 被引量:1
3
作者 刘敏 周健 +4 位作者 胡月明 张林 赵清林 秦雅静 陈瑗瑗 《农业资源与环境学报》 CAS CSCD 北大核心 2024年第1期49-60,共12页
为科学有序开展可恢复耕地资源的整治,本研究提出一种基于XGBoost算法的可恢复耕地的宜耕性评价方法。选取自然条件、区位条件、社会经济状况以及工程条件等4个方面的因素,涉及海拔高程、坡度级别、国家自然等、集块面积、国家经济等、... 为科学有序开展可恢复耕地资源的整治,本研究提出一种基于XGBoost算法的可恢复耕地的宜耕性评价方法。选取自然条件、区位条件、社会经济状况以及工程条件等4个方面的因素,涉及海拔高程、坡度级别、国家自然等、集块面积、国家经济等、地块形状等36项影响因素为自变量,以现状可恢复耕地和耕种耕地二分类为因变量,分析各项影响因素对耕地宜耕性评价的重要程度,并进一步结合皮尔逊共线性分析和指标关联性分析,最终得到21项影响因素及其权重P值,优化后影响因素的权重P值相对稳定,其中自然因素对可恢复耕地宜耕性的影响权重最大,区位因素和工程因素权重次之,社会经济因素的权重最小。经过验证发现,预测耕种情况与实际耕种情况的符合率高达91.87%,且具有良好的泛化能力和鲁棒性,预测效果良好。借助上述模型预测得到的湘阴县可恢复耕地地块的宜耕潜力,形成如下认识:全县中西部平原区可恢复耕地宜耕潜力明显优于东部丘陵山区;可恢复耕地中未耕种和即可恢复地块的宜耕潜力高于工程恢复类地块,这些地块均属于良好的整治地块,可优先整治恢复为耕地;从可恢复耕地具体地类来看,坑塘和养殖坑塘类可恢复耕地的宜耕潜力最大,其次为其他林地类可恢复耕地;在耕地整治过程中,应结合可恢复耕地的宜耕性评价,合理有序地开展可恢复耕地的整治;此外,应开展精细化的耕地“非粮化”监测,实施差异化补偿政策,以遏制耕地“非粮化”。 展开更多
关键词 XGBoost 可恢复耕地 宜耕性 宜耕潜力 湘阴县
下载PDF
基于近红外光谱的卷烟配方模块香型预测
4
作者 王林 郑明明 +3 位作者 王翀 吴庆华 崔南方 李建斌 《华中农业大学学报》 CAS CSCD 北大核心 2024年第1期226-231,共6页
为提高卷烟配方模块的分类识别准确率,并为卷烟配方模块的科学评估提供技术支撑,提出了一种基于近红外光谱特征筛选的卷烟配方模块香型预测方法。选取2017—2019年238个卷烟配方模块样品的近红外光谱数据,结合特征工程中的递归特征消除... 为提高卷烟配方模块的分类识别准确率,并为卷烟配方模块的科学评估提供技术支撑,提出了一种基于近红外光谱特征筛选的卷烟配方模块香型预测方法。选取2017—2019年238个卷烟配方模块样品的近红外光谱数据,结合特征工程中的递归特征消除法和BP神经网络、随机森林、XGBoost3种机器学习技术,构建了基于特征变量的香型预测模型。与全光谱数据训练的分类效果对比,经过递归特征消除法筛选后的光谱特征变量能够有效提升卷烟配方模块香型的识别准确率,其中,XGBoost算法分类效果最佳,模型对测试集的识别准确率达到了90.41%。结果表明,基于近红外光谱特征筛选的香型预测方法对卷烟配方模块的快速定位、科学评价及卷烟配方设计等有一定的辅助决策作用。 展开更多
关键词 烟叶 香型 近红外光谱 递归特征消除 随机森林 XGBoost
下载PDF
Boruta-Optuna-XGBoost融合模型的聚驱油田产量智能预测方法研究
5
作者 田枫 曹凯光 +4 位作者 赵玲 张孟阳 刘芳 苏若禹 常丽娟 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第4期154-160,共7页
在聚驱油田开采时,存在向油层中加注水溶性高分子聚合物的过程,此过程包含大量参数,对油田产量具有较大影响。针对传统油田产量预测方法存在的人工计算量大、准确率低的问题。提出一种Boruta-Optuna-XGBoost融合模型对聚驱油田产量进行... 在聚驱油田开采时,存在向油层中加注水溶性高分子聚合物的过程,此过程包含大量参数,对油田产量具有较大影响。针对传统油田产量预测方法存在的人工计算量大、准确率低的问题。提出一种Boruta-Optuna-XGBoost融合模型对聚驱油田产量进行预测,解决传统方法存在的问题。通过Boruta特征筛选方法进行聚驱油田特征筛选,降低特征冗余,提高特征相关性,避免模型过拟合;使用Optuna超参数优化算法对XGBoost进行自适应超参数评价,提高模型精度;使用最优超参的XGBoost算法对聚驱油田产量进行回归预测,通过算法建立油田注入参数和油田月产量之间的逻辑关系模型,对聚驱油田的月产量进行预测。所提方法应用在大庆油田的实际有效数据的准确率达95%,证明了方法的有效性,能够对油田的生产效益、资源配置和可持续发展产生影响,也为数字化聚驱油田智能产量预测发展提供了新思路。 展开更多
关键词 聚驱油田 产量预测 特征筛选 超参评价 XGBoost
下载PDF
基于极限梯度提升和探地雷达时频特征的水泥路面脱空识别
6
作者 张军 姜文涛 +3 位作者 张云 罗婷倚 余秋琴 杨哲 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期104-114,121,共12页
针对探地雷达(GPR)数据解译依赖于人工经验,存在费时费力和主观偏差的问题,提出了基于极限梯度提升(XGBoost)和GPR时频特征的水泥路面脱空识别方法。采用正演模拟、室内试验和现场试验获得了脱空病害数据源,建立含有标签的脱空GPR数据集... 针对探地雷达(GPR)数据解译依赖于人工经验,存在费时费力和主观偏差的问题,提出了基于极限梯度提升(XGBoost)和GPR时频特征的水泥路面脱空识别方法。采用正演模拟、室内试验和现场试验获得了脱空病害数据源,建立含有标签的脱空GPR数据集;通过重采样方法统一GPR数据采样频率,并对预处理后的GPR数据进行时频域特征提取,建立了包含18个时域和12个频域特征的数据集。以时频域特征为输入,是否存在脱空病害为输出,采用XGBoost算法构建脱空识别模型,并与随机森林(RF)和人工神经网络(ANN)算法进行对比。结果表明,模型的识别准确率排序为XGBoost(98.10%)>ANN(95.10%)>RF(93.17%),XGBoost模型识别精度最高,并能在实际路面上准确定位脱空区域。 展开更多
关键词 道路养护 探地雷达(GPR) 脱空病害 极限梯度提升(XGBoost) 时频域特征
下载PDF
基于Sentinel-5P卫星反演京津冀地区近地面NO_(2)浓度研究
7
作者 周刚 徐彬仁 +3 位作者 徐炜达 程文晨 尹文君 王凌 《环境科学研究》 CAS CSCD 北大核心 2024年第6期1223-1231,共9页
为充分利用卫星传感器在探索长时间、大范围区域内近地面二氧化氮(NO2)浓度时空变化规律方面的优势,进一步提高卫星近地面NO_(2)浓度预测的准确性,本研究以Sentinel-5P卫星TROPOMI传感器观测的对流层NO_(2)柱浓度为基础,提出一种融合多... 为充分利用卫星传感器在探索长时间、大范围区域内近地面二氧化氮(NO2)浓度时空变化规律方面的优势,进一步提高卫星近地面NO_(2)浓度预测的准确性,本研究以Sentinel-5P卫星TROPOMI传感器观测的对流层NO_(2)柱浓度为基础,提出一种融合多源地理要素的“自上而下”近地面NO_(2)浓度遥感估算方法,综合分析随机森林模型(RF)、极致梯度提升树模型(XGBoost)和轻型梯度提升树模型(LightGBM)的性能,基于3种树模型对2019−2020年京津冀地区近地面NO_(2)浓度进行反演,并采用十折交叉验证方法分别对3种模型在近地面NO_(2)浓度预测中的精度差异与稳定性进行了检验比较,利用拟合优度(R2)、均方根误差(RMSE)和平均绝对误差(MAE)对模型进行精度评价,最终选取XGBoost以实现京津冀地区卫星近地面NO_(2)浓度的高效分析预测(R2=0.85,RMSE=6.61μg/m^(3),MAE=2.09μg/m^(3)),在此基础上,从季度、年份等时间尺度对近地面NO_(2)浓度进行空间分析。结果表明:①由于2020年新型冠状病毒感染疫情反弹带来的人类生产活动和出行活动的大量减少,2019年近地面NO_(2)浓度(13.96μg/m^(3))比2020年(13.04μg/m^(3))整体偏高。②近地面NO_(2)浓度具有明显的季节性变化特征,春、夏两季由于大气扩散条件较好,近地面NO_(2)浓度相对较低,在冬季达到全年峰值。③基于SHAP值(沙普利加性解释法)方法对模型特征进行空间分析,并定量研究每个特征对模型的正负贡献程度,其中,对流层NO_(2)柱浓度对预测近地面NO_(2)浓度起到主要促进作用,大气边界层高度对预测近地面NO_(2)浓度起到抑制作用,另外太阳直射辐射、人口密度、地表温度及降水量等指标均对预测近地面NO_(2)浓度有明显影响。研究显示,XGBoost能够更加稳定和准确地预测卫星近地面NO_(2)浓度,为准确识别近地面NO_(2)浓度时空分布特征提供新的手段,可在一定程度上突破现阶段NO_(2)地面监测稀疏的空间局限以及卫星对流层NO_(2)柱浓度代表性不足的缺陷。 展开更多
关键词 NO_(2) TROPOMI 机器学习 XGBoost SHAP值
下载PDF
基于CNN-GRU-ISSA-XGBoost的短期光伏功率预测
8
作者 岳有军 吴明沅 +1 位作者 王红君 赵辉 《南京信息工程大学学报》 CAS 北大核心 2024年第2期231-238,共8页
针对光伏功率随机性及波动性大,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高的问题,提出一种基于卷积神经网络-门控循环单元(CNN-GRU)和改进麻雀搜索算法(ISSA)优化的极限梯度提升(XGBoost)模型的短期光伏功率... 针对光伏功率随机性及波动性大,单一预测模型往往难以准确分析历史数据波动规律,从而导致预测精度不高的问题,提出一种基于卷积神经网络-门控循环单元(CNN-GRU)和改进麻雀搜索算法(ISSA)优化的极限梯度提升(XGBoost)模型的短期光伏功率预测组合模型.首先去除历史数据中的异常值并对其进行归一化处理,利用主成分分析法(PCA)进行特征选取,以便更好地识别影响光伏功率的关键因素.然后采用CNN网络提取数据的空间特征,再经过GRU网络提取时间特征,针对XGBoost模型手动配置参数困难、随机性大的问题,利用ISSA对模型超参数寻优.最后对两种方法预测的结果用误差倒数法减小误差的同时对权重进行更新,得到新的预测值,从而完成对光伏功率的预测.实验结果表明,所提出的CNN-GRU-ISSA-XGBoost组合模型具有更强的适应性和更高的精度. 展开更多
关键词 光伏功率预测 改进麻雀搜索算法 卷积神经网络 门控循环单元 XGBoost模型
下载PDF
基于内容理解与指标融合的高价值专利识别
9
作者 唐恒 张星星 汪满容 《情报杂志》 北大核心 2024年第4期168-174,127,共8页
[研究目的]针对专利文本描述性强,传统高价值专利分类采用指标计算,未能在专利文件中考虑详细的上下文信息或相对长的文本序列等问题,结合专利文本内容和指标特征信息,以内容理解与指标融合的方式识别高价值专利。[研究方法]提出一种基... [研究目的]针对专利文本描述性强,传统高价值专利分类采用指标计算,未能在专利文件中考虑详细的上下文信息或相对长的文本序列等问题,结合专利文本内容和指标特征信息,以内容理解与指标融合的方式识别高价值专利。[研究方法]提出一种基于内容理解与指标融合的高价值专利识别模型,首先利用BERT-BiLSTM抽取专利文本的上下文和顺序特征,然后融合提取的专利文本特征和专利指标特征,最终使用XGBoost算法完成专利的高价值专利分类。[研究结论]经过多组对比实验的验证,提出的方法在识别基本电气原件及电通信技术领域内获得了中国国家知识产权局授予的中国专利奖的精确度达到了74.19%,召回率达到了76.66%,F 1值达到了75.40%,表明该方法能够有效提升高价值专利的分类准确性。 展开更多
关键词 高价值专利 专利识别 专利文本 专利指标 BERT-BiLSTM XGBoost
下载PDF
基于贝叶斯优化XGBoost的石灰窑气预测
10
作者 温后珍 栾仪广 +1 位作者 孟碧霞 陈德斌 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期114-121,共8页
石灰窑是碳酸钙产业的关键生产设备,窑气中的CO_(2)是生产碳酸钙的原料,CO_(2)浓度直接影响碳酸钙产量,然而石灰窑气浓度依靠产品产出后采样化验得到,存在严重的滞后性,无法作为石灰窑在线工艺参数调整的依据。因此提出一种基于贝叶斯... 石灰窑是碳酸钙产业的关键生产设备,窑气中的CO_(2)是生产碳酸钙的原料,CO_(2)浓度直接影响碳酸钙产量,然而石灰窑气浓度依靠产品产出后采样化验得到,存在严重的滞后性,无法作为石灰窑在线工艺参数调整的依据。因此提出一种基于贝叶斯优化的eXtreme Gradient Boosting石灰窑气浓度预测模型BO-XGBoost,根据历史数据预测1 h后的窑气浓度,为生产工艺参数的调整提供依据。该方法首先对石灰窑传感器数据集中的缺失值、异常值进行剔除、插补,然后统一窑气浓度检测历史数据的时间尺度,构成石灰窑气监测数据集,在此基础上提出针对石灰窑气的BO-XGBoost模型。模型经训练后,采用实际生产数据进行测试,并与Light Gradient Boosting Machine(Light-GBM)模型、Category Boosting(Catboost)模型预测结果进行比较,结果表明,所提模型可以实现高维数据集的超参数快速优化,且预测模型有较好的精度,均方根误差(RMSE)达到0.70,平均绝对百分比误差(MAPE)达到2.03%。 展开更多
关键词 石灰窑 石灰窑气 XGBoost模型 贝叶斯优化
下载PDF
矿山救援钻孔中井涌井漏事故预警预测
11
作者 陈卫明 王家文 +3 位作者 凡东 郝世俊 赵江鹏 邱雨 《煤田地质与勘探》 EI CAS CSCD 北大核心 2024年第3期144-152,共9页
为解决矿山应急救援钻孔作业过程中井涌井漏事故预警预测困难等问题,建立了基于机器学习的钻进过程井涌井漏事故预警预测模型。首先对井涌井漏事故发生初期时的钻进参数进行事故表征参数分析;其次对事故表征参数进行数据清洗处理,在此... 为解决矿山应急救援钻孔作业过程中井涌井漏事故预警预测困难等问题,建立了基于机器学习的钻进过程井涌井漏事故预警预测模型。首先对井涌井漏事故发生初期时的钻进参数进行事故表征参数分析;其次对事故表征参数进行数据清洗处理,在此基础上,通过XGBoost事故诊断预警模型对井涌井漏事故进行早期诊断识别;随后建立PSO-LSTM事故发展预测模型,对事故发生后的孔底压力参数发展趋势进行预测,提前掌握钻进事故发展状态;最后通过实际钻进数据对预警预测模型的有效性进行验证。结果表明:XGBoost事故诊断预警模型能根据总池体积、立管压力、出入口流量差和动力头负荷这4种钻进参数的异常变化,快速准确诊断钻进过程中的井涌井漏事故;PSO-LSTM事故发展状态预测模型能充分学习孔底压力参数发展规律,综合EMAP、EMA、ERMS、R2这4项误差评价指标,PSO-LSTM模型相较于BP、RNN、SVM模型的预测性能最佳,能准确预测事故发生之后的孔底压力发展趋势,提前掌握井涌井漏事故的严重程度和发展态势。研究结果丰富了钻进过程井涌井漏事故预警预测方法,提高了矿山事故地面救援的可靠性,对矿山应急救援钻孔作业过程中事故控制有着借鉴与指导作用。 展开更多
关键词 矿山救援 钻进过程 预警预测 XGBoost PSO-LSTM 机器学习 井涌井漏
下载PDF
基于特征变量筛选的无人机多光谱遥感土壤含水量反演
12
作者 张成才 王蕊 +2 位作者 侯佳彤 姜明梁 祝星星 《中国农村水利水电》 北大核心 2024年第5期147-154,共8页
土壤含水量是影响农作物生长的重要因素之一,对作物估产和旱情监测具有重要作用。在土壤含水量反演时,一般是提取多个光谱变量进行反演,但变量之间包含的光谱信息可能存在冗余重叠,为提取有效特征变量,使其相互独立,论文选取特征变量筛... 土壤含水量是影响农作物生长的重要因素之一,对作物估产和旱情监测具有重要作用。在土壤含水量反演时,一般是提取多个光谱变量进行反演,但变量之间包含的光谱信息可能存在冗余重叠,为提取有效特征变量,使其相互独立,论文选取特征变量筛选方法,并验证其在土壤含水量反演中的适用性。研究基于无人机多光谱影像计算归一化植被指数(Normalized Difference Vegetation Index,NDVI)等12种植被指数,结合无人机热红外数据计算地表温度(Land Surface Temperature,LST)和对应温度植被干旱指数(Temperature Vegetation Dryness Index,TVDI),以及miniSAR数据处理得到的4种后向散射系数,采用XGBoost特征变量和最优子集选择算法(Best Subset Selection,BSS)筛选最优变量组合,然后利用偏最小二乘回归(Partial Least Squares Regression,PLSR)和随机森林回归(Random Forest Regression,RFR)算法反演实验区冬小麦抽穗期的土壤含水量。研究结果表明:①0~20 cm深度的反演结果均优于0~10 cm深度;②对比XGBoost-PLSR、XGBoost-RFR、BSS-PLSR以及BSS-RFR四种土壤含水量反演模型,BSS-RFR模型不同深度下的反演精度最高;③0~10 cm土壤深度下XGBoost-PLSR模型的反演精度优于XGBoost-RFR,0~20 cm深度下则两者相反,0~20 cm深度下,BSS-RFR模型的反演精度均高于BSS-PLSR。研究成果可为无人机多光谱遥感反演土壤含水量提供理论和技术支撑,为卫星遥感大范围土壤水分监测提供检验依据。 展开更多
关键词 土壤含水量 无人机 XGBoost特征筛选 最优子集选择 偏最小二乘回归 随机森林回归
下载PDF
基于BiLSTM-XGBoost混合模型的储层岩性识别
13
作者 杜睿山 黄玉朋 +2 位作者 孟令东 张轶楠 周长坤 《计算机系统应用》 2024年第6期108-116,共9页
储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidi... 储层岩性分类是地质研究基础,基于数据驱动的机器学习模型虽然能较好地识别储层岩性,但由于测井数据是特殊的序列数据,模型很难有效提取数据的空间相关性,造成模型对储层识别仍存在不足.针对此问题,本文结合双向长短期循环神经网络(bidirectional long short-term memory,BiLSTM)和极端梯度提升决策树(extreme gradient boosting decision tree,XGBoost),提出双向记忆极端梯度提升(BiLSTM-XGBoost,BiXGB)模型预测储层岩性.该模型在传统XGBoost基础上融入了BiLSTM,大大增强了模型对测井数据的特征提取能力.BiXGB模型使用BiLSTM对测井数据进行特征提取,将提取到的特征传递给XGBoost分类模型进行训练和预测.将BiXGB模型应用于储层岩性数据集时,模型预测的总体精度达到了91%.为了进一步验证模型的准确性和稳定性,将模型应用于UCI公开的Occupancy序列数据集,结果显示模型的预测总体精度也高达93%.相较于其他机器学习模型,BiXGB模型能准确地对序列数据进行分类,提高了储层岩性的识别精度,满足了油气勘探的实际需要,为储层岩性识别提供了新的方法. 展开更多
关键词 神经网络 机器学习 测井数据 岩性分类 BiLSTM XGBoost
下载PDF
一种基于XGBoost的用户行为异常检测方法
14
作者 王江立 段蔚 +1 位作者 黄逸飞 李鑫 《计算机与数字工程》 2024年第3期757-760,785,共5页
伴随企业业务的不断扩增和电子化发展,企业自身数据和负载数据都开始暴增。然而,作为企业核心资产之一的内部数据,却面临着日益严峻的安全威胁。越来越多以周期长、频率低、隐蔽强为典型特征的非明显攻击绕过传统安全检测方法,对大量数... 伴随企业业务的不断扩增和电子化发展,企业自身数据和负载数据都开始暴增。然而,作为企业核心资产之一的内部数据,却面临着日益严峻的安全威胁。越来越多以周期长、频率低、隐蔽强为典型特征的非明显攻击绕过传统安全检测方法,对大量数据造成损毁。对此,根据用户、实体、行为关联,提出整合可以反映用户行为基线的各类数据,提取几种最能反映用户异常的基础特征,利用XGBoost的特征选择策略与FCM聚类算法结合,通过异常打分,定位异常风险最大的一批用户。结果显示,新提出的异常检测算法有着82%以上的准确率,以及86%以上的召回率。 展开更多
关键词 XGBoost FCM 用户行为 异常检测
下载PDF
基于ISSA-XGBoost模型的多特征融合露天矿卡车行程时间预测
15
作者 顾清华 王燕 +1 位作者 王倩 魏瑾瑜 《有色金属(矿山部分)》 2024年第1期1-10,共10页
针对露天矿运输系统卡车行程时间预测问题,提出了一种基于特征选择及改进麻雀算法优化XGBoost的露天矿卡车行程时间预测模型。模型充分考虑了卡车特征、道路特征、气象特征以及时间特征对卡车行程时间的影响,并使用皮尔逊系数法深入分... 针对露天矿运输系统卡车行程时间预测问题,提出了一种基于特征选择及改进麻雀算法优化XGBoost的露天矿卡车行程时间预测模型。模型充分考虑了卡车特征、道路特征、气象特征以及时间特征对卡车行程时间的影响,并使用皮尔逊系数法深入分析影响因素的贡献度。针对麻雀算法中全局搜索能力薄弱的问题引入反向学习和螺旋搜索策略,以提高算法的收敛性能。最后,使用改进的麻雀算法对XGBoost的关键参数进行寻优,进而构建露天矿卡车行程时间预测模型。选取国内某大型露天矿卡车调度系统采集的数据进行仿真模拟,并将所提出模型与SVM、BP、RBF和RF等其他机器学习模型进行对比。结果表明:所提出模型的预测误差均低于其他模型,相关系数可达0.9819。开发的模型和分析结果可以极大地帮助决策者规划、运营和管理更高效的露天矿运输系统。 展开更多
关键词 行程时间预测 露天矿卡车 XGBoost 改进麻雀算法 均值滤波
下载PDF
结合SVM与XGBoost的链式多路径覆盖测试用例生成
16
作者 钱忠胜 俞情媛 +3 位作者 张丁 姚昌森 秦朗悦 成轶伟 《软件学报》 EI CSCD 北大核心 2024年第6期2795-2820,共26页
机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借... 机器学习方法可很好地与软件测试相结合,增强测试效果,但少有学者将其运用于测试数据生成方面.为进一步提高测试数据生成效率,提出一种结合SVM(support vector machine)和XGBoost(extreme gradient boosting)的链式模型,并基于此模型借助遗传算法实现多路径测试数据生成.首先,利用一定样本训练若干个用于预测路径节点状态的子模型(SVM和XGBoost),通过子模型的预测精度值筛选最优子模型,并根据路径节点顺序将其依次链接,形成一个链式模型C-SVMXGBoost(chained SVM and XGBoost).在利用遗传算法生成测试用例时,使用训练好的链式模型代替插桩法获取测试数据覆盖路径(预测路径),寻找预测路径与目标路径相似的路径集,对存在相似路径集的预测路径进行插桩验证,获取精确路径,计算适应度值.在交叉变异过程中引入样本集中路径层级深度较大的优秀测试用例进行重用,生成覆盖目标路径的测试数据.最后,保留进化生成中产生的适应度较高的个体,更新链式模型C-SVMXGBoost,进一步提高测试效率.实验表明,C-SVMXGBoost较其他各对比链式模型更适合解决路径预测问题,可提高测试效率.并且通过与已有经典方法相比,所提方法在覆盖率上提高可达15%,平均进化代数也有所降低,在较大规模程序上其降低百分比可达65%. 展开更多
关键词 测试用例 SVM XGBoost 链式模型 多路径覆盖
下载PDF
基于ISSA-XGBoost的电能质量扰动识别方法研究
17
作者 商立群 李朝彪 +2 位作者 邓力文 郝天奇 刘晗 《电力系统保护与控制》 EI CSCD 北大核心 2024年第13期115-124,共10页
针对传统电能质量扰动(power quality disturbances,PQDs)识别中特征提取有冗余,识别精度不高等问题,提出了一种基于改进麻雀搜索算法(improved sparrow search algorithm,ISSA)优化特征选择和极致梯度提升(eXtreme gradient boosting,X... 针对传统电能质量扰动(power quality disturbances,PQDs)识别中特征提取有冗余,识别精度不高等问题,提出了一种基于改进麻雀搜索算法(improved sparrow search algorithm,ISSA)优化特征选择和极致梯度提升(eXtreme gradient boosting,XGBoost)的电能质量扰动识别方法。首先对电能质量扰动信号进行S变换,提取61种电能质量特征。再通过ISSA同时选择最优特征子集和XGBoost中最优参数,剔除冗余特征,提高识别精度。最后根据优化后的最优特征子集和XGBoost实现电能质量扰动的识别。仿真结果表明,所提出的方法能有效选择最优特征子集,对噪声环境下的19种电能质量扰动信号进行高效识别,并且具有较高的识别精度。 展开更多
关键词 电能质量 扰动识别 XGBoost 麻雀搜索算法
下载PDF
利用改进XGBoost模型预测和分析湿地潜流带地下水中硝态氮含量
18
作者 周念清 夏明锐 +3 位作者 陆帅帅 郭梦申 王在艾 赵文刚 《上海国土资源》 2024年第2期41-47,共7页
湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包... 湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包括氧化还原电位(Eh)、溶解氧(DO)、水温(T)、地下水位(H)及埋深、酸碱度(pH)以及溶解有机碳(DOC)等。利用XGBoost方法建立机器学习模型,用于预测硝态氮的相对浓度,并通过贝叶斯优化(BO)、麻雀搜索算法(SSA)、粒子群算法(PSO)分别对XGBoost预测模型进行超参数优化,得到最佳XGBoost预测模型(BO-XGBoost)。在此基础上,采用SHAP(SHapley Additive exPlanations)方法对BO-XGBoost模型进行可解释性分析。研究结果表明,BO-XGBoost模型的性能最好,在训练集与测试集的决定系数均超过0.90;可解释性分析结果和相关分析都揭示了Eh、DO、T、H、pH和DOC等影响因子对湿地潜流带地下水中硝态氮含量的影响是逐渐降低的规律。 展开更多
关键词 湿地潜流带 硝态氮 机器学习 XGBoost SHAP
下载PDF
基于蜣螂优化-集成加权融合的NO_(x)浓度动态预测
19
作者 金秀章 畅晗 +1 位作者 赵大勇 赵术善 《计量学报》 CSCD 北大核心 2024年第4期600-608,共9页
针对SCR入口NO_(x)浓度单一预测模型无法满足在不同工况下保持预测精度的问题,提出了一种基于蜣螂优化(dung beetle optimizer,DBO)集成模型加权融合的预测SCR入口NO_(x)浓度的动态模型。首先使用CatBoost与LightGBM的混合模型在筛选辅... 针对SCR入口NO_(x)浓度单一预测模型无法满足在不同工况下保持预测精度的问题,提出了一种基于蜣螂优化(dung beetle optimizer,DBO)集成模型加权融合的预测SCR入口NO_(x)浓度的动态模型。首先使用CatBoost与LightGBM的混合模型在筛选辅助变量的同时,求取辅助变量的迟延时间和阶次信息,并根据以上信息确定预测模型的输入变量;然后建立由LightGBM,XGBoost与CatBoost组成的集成模型,并使用蜣螂优化算法对预测结果进行加权融合;最后将DBO-集成加权融合动态预测模型与3种单模型和蜣螂算法优化2种模型加权融合的预测模型进行对比。结果证明DBO综合加权融合动态预测模型的评价指标优于其他模型,具有更高的预测精度、实时性和适应性,能够更好地满足不同工况下的NO_(x)浓度预测要求。 展开更多
关键词 化学计量 NO_(x)排放预测 蜣螂优化算法 CatBoost LightGBM XGBoost 集成模型
下载PDF
基于Stacking融合模型的PHEV复合储能系统实时能量分配策略
20
作者 吴忠强 马博岩 《计量学报》 CSCD 北大核心 2024年第1期73-81,共9页
为了解决插电式混合动力汽车单一电池低比功率、无法响应暂态功率需求的问题,设计了电池和超级电容并联式复合储能系统。同时针对采用动态规划法优化负载电流分配时缺乏实时性的问题,利用不同驱动工况下动态规划优化的结果构成训练集进... 为了解决插电式混合动力汽车单一电池低比功率、无法响应暂态功率需求的问题,设计了电池和超级电容并联式复合储能系统。同时针对采用动态规划法优化负载电流分配时缺乏实时性的问题,利用不同驱动工况下动态规划优化的结果构成训练集进行训练,并综合GRU网络以及XGBoost算法,提出了一种Stacking集成学习框架下多模型融合的能量分配策略。仿真结果表明,与仅使用单一电池的储能系统相比,基于Stacking融合模型的实时能量分配系统在UDDS和US06两种循环工况下,电池峰值电流分别降低了48.7%和50.8%,有效削弱了电池的峰值电流,提升了电池的整体性能。 展开更多
关键词 电学计量 复合储能系统 插电式混合动力汽车 动态规划 XGBoost Stacking融合模型
下载PDF
上一页 1 2 81 下一页 到第
使用帮助 返回顶部