期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
基于Shapley additive explanations(SHAP)分析乳腺X线检查假阴性乳腺癌的特征 被引量:3
1
作者 杨蔚 张宁妹 +1 位作者 张朝林 尹清云 《中国医学计算机成像杂志》 CSCD 北大核心 2023年第3期271-276,共6页
目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险... 目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险因素。应用SHAP分析各独立危险因素的贡献价值。结果:1505个病灶纳入研究,MG假阴性乳腺癌373个。较小的病灶、致密或不均匀致密的MG密度、无可疑钙化、非肿块样强化(NME)、原位癌和腋窝淋巴结阴性与MG假阴性乳腺癌独立相关,上述参数构建的联合模型具有良好的预测效能(AUC=0.871)。根据SHAP分析,病灶大小、MG密度和病灶MRI强化类型是导致MG假阴性的主要因素;钙化状态、病理类型和腋窝淋巴结状态是重要补充。结论:MG假阴性乳腺癌具有一定的特征,此类患者需补充乳腺MRI检查以提高癌灶的检出率。 展开更多
关键词 乳腺肿瘤 X线摄影 磁共振成像 假阴性 shap
下载PDF
Investigation of feature contribution to shield tunneling-induced settlement using Shapley additive explanations method 被引量:9
2
作者 K.K.Pabodha M.Kannangara Wanhuan Zhou +1 位作者 Zhi Ding Zhehao Hong 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2022年第4期1052-1063,共12页
Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the sett... Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the settlement caused by tunneling.However,well-performing ML models are usually less interpretable.Irrelevant input features decrease the performance and interpretability of an ML model.Nonetheless,feature selection,a critical step in the ML pipeline,is usually ignored in most studies that focused on predicting tunneling-induced settlement.This study applies four techniques,i.e.Pearson correlation method,sequential forward selection(SFS),sequential backward selection(SBS)and Boruta algorithm,to investigate the effect of feature selection on the model’s performance when predicting the tunneling-induced maximum surface settlement(S_(max)).The data set used in this study was compiled from two metro tunnel projects excavated in Hangzhou,China using earth pressure balance(EPB)shields and consists of 14 input features and a single output(i.e.S_(max)).The ML model that is trained on features selected from the Boruta algorithm demonstrates the best performance in both the training and testing phases.The relevant features chosen from the Boruta algorithm further indicate that tunneling-induced settlement is affected by parameters related to tunnel geometry,geological conditions and shield operation.The recently proposed Shapley additive explanations(SHAP)method explores how the input features contribute to the output of a complex ML model.It is observed that the larger settlements are induced during shield tunneling in silty clay.Moreover,the SHAP analysis reveals that the low magnitudes of face pressure at the top of the shield increase the model’s output。 展开更多
关键词 feature Selection Shield operational parameters Pearson correlation method Boruta algorithm shapley additive explanations(shap) analysis
下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
3
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 北大核心 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
下载PDF
基于SHAP的可解释机器学习的滑坡易发性评价模型
4
作者 崔婷婷 安雪莲 +2 位作者 孙德亮 陈东升 朱有晨 《成都理工大学学报(自然科学版)》 北大核心 2025年第1期153-172,共20页
机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过... 机器学习在构建滑坡易发性评价模型中因其训练复杂且预测结果难以解释而发展受限。通过SHAP(SHapley Additive exPlanations)结合机器学习模型揭示各影响因子对滑坡发育的影响,增强模型可信度与可解释性。以三峡库区忠县为研究区,通过随机森林、XGBoost(eXtreme Gradient Boosting)以及深度随机森林机器学习算法结合贝叶斯优化算法分别构建滑坡易发性评价模型;利用混淆矩阵及受试者工作特征曲线开展评价精度验证;基于4种分级方法得到滑坡易发性区划图;通过SHAP分析影响滑坡发育的主导因子。结果表明,优化后的XGBoost模型受试者工作特征曲线下面积(AUC)值(0.817)高于随机森林的AUC值(0.803)和深度随机森林的AUC值(0.806);不同分级方式下的易发性区划图分布差异很大,其中基于相等间隔法和XGBoost模型的分级效果相对更好,极高-高易发区主要集中在研究区的东南部和东北部,特别是长江及其支流两岸。SHAP图揭示各主导因子不同特征值对滑坡发育有明显差异,高程和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。本研究的XGBoost模型具有较高的预测精度,模型可解释性强,为滑坡灾害的精准防治提供科学依据。 展开更多
关键词 XGBoost 深度随机森林 shap 三峡库区 滑坡易发性评价
下载PDF
Prediction and optimization of flue pressure in sintering process based on SHAP
5
作者 Mingyu Wang Jue Tang +2 位作者 Mansheng Chu Quan Shi Zhen Zhang 《International Journal of Minerals,Metallurgy and Materials》 SCIE EI CAS 2025年第2期346-359,共14页
Sinter is the core raw material for blast furnaces.Flue pressure,which is an important state parameter,affects sinter quality.In this paper,flue pressure prediction and optimization were studied based on the shapley a... Sinter is the core raw material for blast furnaces.Flue pressure,which is an important state parameter,affects sinter quality.In this paper,flue pressure prediction and optimization were studied based on the shapley additive explanation(SHAP)to predict the flue pressure and take targeted adjustment measures.First,the sintering process data were collected and processed.A flue pressure prediction model was then constructed after comparing different feature selection methods and model algorithms using SHAP+extremely random-ized trees(ET).The prediction accuracy of the model within the error range of±0.25 kPa was 92.63%.SHAP analysis was employed to improve the interpretability of the prediction model.The effects of various sintering operation parameters on flue pressure,the relation-ship between the numerical range of key operation parameters and flue pressure,the effect of operation parameter combinations on flue pressure,and the prediction process of the flue pressure prediction model on a single sample were analyzed.A flue pressure optimization module was also constructed and analyzed when the prediction satisfied the judgment conditions.The operating parameter combination was then pushed.The flue pressure was increased by 5.87%during the verification process,achieving a good optimization effect. 展开更多
关键词 sintering process flue pressure shapley additive explanation PREDICTION OPTIMIZATION
下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:1
6
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 shap 模型可解释性
下载PDF
基于CatBoost-SHAP模型的滑坡易发性建模及可解释性 被引量:1
7
作者 曾韬睿 王林峰 +2 位作者 张俞 程平 吴帆 《中国地质灾害与防治学报》 CSCD 2024年第1期37-50,共14页
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分... 文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计,进一步划分为4,6,8,12,16,20级。随后,引入了类别增强提升树模型(CatBoost)以评估不同工况下的滑坡易发性值,再结合受试者曲线与沙普利加性解释法分析,对建模过程中的不确定性和可解释性进行了深入研究,目的在于确定最优建模策略。结果表明:(1)在CatBoost模型计算中,河流距离成为最关键的影响因子,其次是与地质条件、人类活动相关的因子;(2)不分级工况下,模型能够获得最高的AUC值,达到0.866;(3)相较于等间距法,自然断点法的划分策略展现出更佳的泛化能力,且模型预测性能随着分级数量的增加而增加;(4)沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解,提高滑坡预测的准确性和可靠性,为相关地区的防灾减灾工作提供科学依据。 展开更多
关键词 滑坡 易发性建模 可解释性 CatBoost模型 沙普利加性解释法模型 台风诱发滑坡
下载PDF
基于集成因子优选算法的面板堆石坝变形预测模型
8
作者 郑好 李登华 丁勇 《排灌机械工程学报》 北大核心 2025年第2期178-186,共9页
面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.... 面板堆石坝变形主要受外部荷载和内部材料蠕变影响,而影响因子过多会造成特征冗余,引起预测精度过拟合问题;因子过少导致信息表达不全,造成预测效果差,模型泛化能力不足等问题.因此构建涵盖面广,可解释性强的因子集并从中优选格外重要.针对上述问题,文中提出基于集成因子优选算法的面板堆石坝变形预测模型,使用ReliefF与沙普利加性解释(SHAP)算法通过权重集成获得因子贡献值排序,再分析因子累计贡献率差量阈值剔除非关键因子,获得关键因子.以新疆某混凝土面板堆石坝为例,以特征缩减率FRR、归一化平均绝对百分比误差nMAPE、平均绝对误差MAE、均方误差MSE以及决定系数R^(2)为评价指标,试验结果表明文中提出的算法面对不同的预测模型都可准确地获得最佳因子,有效地提升了预测精度.相对于传统因子优选算法适应性更强,预测能力提升最显著,解决了影响因子冗余或者欠缺带来的预测能力较低的问题,提高了模型的泛化能力,为大坝安全监测研究提供了行之有效的因子优选方法. 展开更多
关键词 大坝安全监测 因子优选 shap理论 贡献度排序
下载PDF
基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型 被引量:4
9
作者 陈曦泽 贾俊峰 +2 位作者 白玉磊 郭彤 杜修力 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第6期1061-1070,共10页
为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV... 为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合.采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较.使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释.结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出. 展开更多
关键词 钢管混凝土(CFST)柱 轴向承载力 极限梯度提升(XGBoost) 超参数优化 shap 可解释性
下载PDF
基于CatBoost-MOEAD的大直径泥水盾构姿态多目标预测与优化
10
作者 吴贤国 刘俊 +1 位作者 王静怡 覃亚伟 《中国安全科学学报》 CAS CSCD 北大核心 2024年第10期50-57,共8页
为避免盾构掘进过程中出现蛇形、轴线偏离等姿态异常问题影响施工安全,提出一种结合类别提升(CatBoost)算法和基于分解的多目标优化算法(MOEAD)的大直径泥水盾构姿态控制方法;构建一个盾构姿态预测模型,该模型包含19个输入参数和6个输... 为避免盾构掘进过程中出现蛇形、轴线偏离等姿态异常问题影响施工安全,提出一种结合类别提升(CatBoost)算法和基于分解的多目标优化算法(MOEAD)的大直径泥水盾构姿态控制方法;构建一个盾构姿态预测模型,该模型包含19个输入参数和6个输出参数,利用CatBoost算法构建输入参数与输出参数之间的非线性映射关系;采用沙普利加性解释法(SHAP)分析输入参数对盾构姿态的影响;结合多目标优化算法构建CatBoost-MOEAD盾构姿态多目标优化模型,将所提模型运用到武汉长江大直径泥水盾构隧道工程中,分析验证所提方法的适用性和有效性。结果表明:CatBoost预测模型能够高效地预测大直径泥水盾构的姿态,其中6个盾构姿态目标的决定系数范围为0.931~0.974,均方根误差范围为0.030~0.880,误差范围为0.039~1.057;对盾构姿态影响较大的施工参数中推进组推力对盾构姿态的影响最为显著;通过研发的CatBoost-MOEAD盾构姿态多目标优化方法,盾构姿态的优化效果显著,优化率可达38.86%。 展开更多
关键词 类别提升(CatBoost) 基于分解的多目标优化算法(MOEAD) 大直径泥水盾构 盾构姿态 多目标优化 沙普利加性解释法(shap)
下载PDF
山区公路交叉口驾驶避险决策行为特性分析
11
作者 秦雅琴 包丽馨 +2 位作者 陈亮 勾钰 王锦锐 《安全与环境学报》 CAS CSCD 北大核心 2024年第6期2295-2304,共10页
为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾... 为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾驶人扫视、眨眼、注视等眼动特征数据。基于随机森林构建驾驶避险决策行为模型,然后引入沙普利加和解释(SHapley Additive exPlanation, SHAP)框架进一步分析车辆、眼动特征与驾驶避险行为之间的非线性关系。结果表明:模型对纵、横向避险行为预测的准确率分别为84.77%、94.70%;纵向速度标准差、扫视持续时间标准差、轨迹偏差标准差、侧向速度标准差与驾驶避险决策行为存在明显关联,如纵向速度标准差过大(约大于10 km/h),纵向“停车避险”可能性明显增加。 展开更多
关键词 安全工程 驾驶避险 决策行为 驾驶模拟 分类预测 沙普利加和解释(shap)
下载PDF
页岩油水平井产量影响因素分析及压裂参数优化决策
12
作者 刘巍 曹小朋 +2 位作者 胡慧芳 程紫燕 卜亚辉 《油气藏评价与开发》 CSCD 北大核心 2024年第5期764-770,778,共8页
济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平... 济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平井产量的影响,基于矿场实际数据开展因素关联性分析和规律挖掘。利用灰色关联分析方法及主成分分析方法定量计算页岩油水平井生产90 d、180 d和270 d的平均日产油量与压裂液用量、加砂量等影响因素之间的相关性,并在此基础上建立页岩油产能预测模型,结合SHAP算法对压裂参数进行优化分析。结果表明:压裂液用量、加砂量和破裂事件数是影响产量的主要工程参数,灰质含量、总有机碳含量和页岩孔隙性是影响产量的主要地质参数;随着生产时间的延长,地质因素对产量的影响逐渐增强,工程因素对产量的影响逐渐减弱;压裂参数优化分析确定了40~45 m压裂段长,2700 m3单段压裂液用量,180 m3单段加砂量为最佳压裂施工参数,为页岩油水平井的开发决策和压裂设计提供了新的技术思路。 展开更多
关键词 水平井产量 影响因素分析 灰色关联分析 shap算法 页岩油
下载PDF
急性心肌梗死合并肾功能不全患者主要不良心脑血管事件风险预测模型构建
13
作者 韩福生 田雪 +1 位作者 米玉红 何华 《中国医药》 2024年第7期975-979,共5页
目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集... 目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集患者一般特征、生命体征、合并症和实验室检查结果等临床资料。采用简单随机抽样法按80%∶20%将研究对象分为训练集(592例)和测试集(148例),采用逻辑回归、随机森林、极限梯度提升(XGBoost)、支持向量机和深度神经网络5种机器学习算法分别构建MACCE的预测模型。采用受试者工作特征曲线下面积(AUC)评估模型的可靠性,选择最优模型。使用Shapley加性解释算法评估特征影响并进行特征选择构建最终模型。结果740例AMI合并肾功能不全患者中有473例(63.9%)发生MACCE。XGBoost模型的AUC最大(AUC=0.862)。在根据特征重要性等级对特征进行减少后,建立了具有5个特征的可解释的最终XGBoost模型。最终的模型可以在内部验证中准确预测MACCE发生(AUC=0.955),其中影响XGBoost模型重要临床特征分别为血尿酸、白蛋白、糖化血清白蛋白,体重和血小板计数。结论基于机器学习算法的5种模型中XGBoost模型预测AMI合并肾功能不全患者发生MACCE效果最佳。 展开更多
关键词 急性心肌梗死 肾功能不全 机器学习 主要不良心脑血管事件 shapley加性解释算法
下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
14
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
下载PDF
利用改进XGBoost模型预测和分析湿地潜流带地下水中硝态氮含量
15
作者 周念清 夏明锐 +3 位作者 陆帅帅 郭梦申 王在艾 赵文刚 《上海国土资源》 2024年第2期41-47,共7页
湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包... 湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包括氧化还原电位(Eh)、溶解氧(DO)、水温(T)、地下水位(H)及埋深、酸碱度(pH)以及溶解有机碳(DOC)等。利用XGBoost方法建立机器学习模型,用于预测硝态氮的相对浓度,并通过贝叶斯优化(BO)、麻雀搜索算法(SSA)、粒子群算法(PSO)分别对XGBoost预测模型进行超参数优化,得到最佳XGBoost预测模型(BO-XGBoost)。在此基础上,采用SHAP(SHapley Additive exPlanations)方法对BO-XGBoost模型进行可解释性分析。研究结果表明,BO-XGBoost模型的性能最好,在训练集与测试集的决定系数均超过0.90;可解释性分析结果和相关分析都揭示了Eh、DO、T、H、pH和DOC等影响因子对湿地潜流带地下水中硝态氮含量的影响是逐渐降低的规律。 展开更多
关键词 湿地潜流带 硝态氮 机器学习 XGBoost shap
下载PDF
基于随机森林法的山核桃林地土壤速效养分含量空间分布特征研究 被引量:1
16
作者 凌晓丹 王罗其 +3 位作者 赵科理 傅伟军 叶正钱 丁立忠 《生态学报》 CAS CSCD 北大核心 2024年第2期662-675,共14页
土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机... 土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机森林(RF)、普通克里格(OK)和Shapley加性解释(SHAP)方法,结合地形因子、气候因子、土壤因子、遥感因子等环境变量,对山核桃林地土壤碱解氮(AN)、有效磷(AP)、速效钾(AK)的空间分布特征进行分析。研究结果表明:相比于OK模型,基于环境协变量所构建的RF模型对AN、AP和AK含量空间分布预测表现最佳,R^(2)分别为0.68、0.60和0.64,均方根误差(RMSE)分别为20.005、10.287和22.426,平均绝对误差(MAE)分别为15.425、7.709和21.628。RF模型SHAP分析显示,AN和AK含量分布主要受土壤有机质(SOM)的影响,并且SOM与AN和AK存在正相关性;AP主要受pH的影响,其次为色调指数,AP与pH和色调指数均具有负相关性;AK和AP同时受到海拔和坡向的影响。两种模型预测的氮磷钾空间分布趋势总体相似,不同速效养分存在明显的空间异质性。碱解氮高值区域主要分布于研究区东部;有效磷高值区域主要分布于研究区西部,但分散度高;速效钾高值区域则主要分布于研究区中部。总体而言,基于随机森林模型可以高精度模拟山核桃林地土壤氮磷钾含量空间分布特征,并依据主要环境协变量对土壤氮磷钾的影响关系,提出相应改良措施。在有效磷含量低值区域可以施用石灰来缓解土壤酸化,同时补追磷肥;碱解氮含量高值区域可以合理减少氮肥施用;速效钾含量低值区域合理施加钾肥;对于海拔较高及迎风坡多降雨的区域,可以构建林下高效水土保持植被,减轻水土流失;在林地施用有机肥料,改善土壤理化性质,增加土壤养分含量。 展开更多
关键词 山核桃林地 随机森林 shapley加性解释 速效养分
下载PDF
基于校准窗口集成与耦合市场特征的可解释双层日前电价预测 被引量:1
17
作者 刘慧鑫 沈晓东 +3 位作者 魏泽涛 刘友波 刘俊勇 白元宝 《中国电机工程学报》 EI CSCD 北大核心 2024年第4期1272-1285,I0003,共15页
随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在... 随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在工程应用中可信度偏低。针对上述问题,该文提出一种考虑校准窗口集成与耦合市场特征的可解释双层日前电价预测框架。内层框架为基于改进自适应噪声完备集合经验模态分解(improved complete ensemble empirical mode decomposition,ICEEMDAN)的择优预测,首先分解原始电价序列,然后应用Lasso估计回归(lassoestimated autoregressive,LEAR)、长期和短期时间序列网络(long-term and short-term time-series networks,LSTNet)、卷积神经网络-长短记忆神经网络(convolutionalneuralnetworks-longshort termmemory,CNN-LSTM)、移动平均(autoregressive integrated moving average,ARIMA)和核极限学习机(kernel extreme learning machines,KELM)模型预测子序列并选择最优预测算法。外层框架为基于贝叶斯模型平均(bayes modelaveraging,BMA)的校准窗口集成预测,针对每个不同校准窗口长度数据集下的预测分配权重并集成得到预测电价。最后,通过可解释方法沙普利加性解释模型(shapley additiveexplanations,SHAP)分析耦合市场特征如何影响预测电价。该文通过北欧电力市场数据集的算例分析证明了所提算法的优越性和校准窗口集成方案的有效性。 展开更多
关键词 校准窗口集成 耦合市场特征 双层预测框架 改进自适应噪声完备集合经验模态分解(ICEEMDAN) 贝叶斯模型平均(BMA) 沙普利加性解释模型(shap)
下载PDF
基于机器学习的带被动阻尼直流微电网系统的稳定性检测
18
作者 刘笑 杨建 +2 位作者 李力 董密 宋冬然 《电工技术学报》 EI CSCD 北大核心 2024年第8期2281-2293,2324,共14页
直流微电网中恒功率负荷(CPL)具有负阻尼特性,该特性会降低系统稳定性。为此,通过在滤波器上添加被动阻尼来增强直流微电网系统的稳定性,并提出一种基于机器学习的方法来检测带被动阻尼直流微电网系统的稳定性。首先,建立带被动阻尼直... 直流微电网中恒功率负荷(CPL)具有负阻尼特性,该特性会降低系统稳定性。为此,通过在滤波器上添加被动阻尼来增强直流微电网系统的稳定性,并提出一种基于机器学习的方法来检测带被动阻尼直流微电网系统的稳定性。首先,建立带被动阻尼直流微电网系统的小信号模型,以此来确定影响系统稳定性的参数。其次,以所选系统参数为变量建立仿真场景,以此来获取用于机器学习算法训练的数据集。再次,提出一种基于轻量型梯度提升机(LGBM)的直流微电网稳定性检测模型,并采用沙普利加解释法(SHAP)分析所选参数对LGBM预测结果和直流微电网系统稳定性的影响。最后,通过仿真和硬件在环实验验证所提方法的有效性和优越性。 展开更多
关键词 直流微电网 稳定性检测 被动阻尼 轻量型梯度提升机 沙普利加解释
下载PDF
基于仿生技术和反向传播神经网络的黄芪产地判别模型构建研究
19
作者 陈万金 李虹 +8 位作者 张沛沛 邵炜娴 王越 范昕煜 赵婷 刘凤波 魏胜利 于芳 张媛 《中南药学》 CAS 2024年第12期3221-3228,共8页
目的 基于仿生技术和反向传播神经网络(BPNN)构建黄芪的产地鉴别模型。方法 采用色度计、电子鼻和电子舌共测得21项指标,通过RFI进行特征筛选后得到14项指标,并将黄芪产地鉴定问题建模为多分类问题。通过对随机森林(RF)、支持向量机(SVM... 目的 基于仿生技术和反向传播神经网络(BPNN)构建黄芪的产地鉴别模型。方法 采用色度计、电子鼻和电子舌共测得21项指标,通过RFI进行特征筛选后得到14项指标,并将黄芪产地鉴定问题建模为多分类问题。通过对随机森林(RF)、支持向量机(SVM)和BPNN这三种机器学习模型的比较,我们建立了一个基于BPNN的黄芪产地分类决策系统。结果 BPNN仅用了11个特征变量就能够较好地预测黄芪产地。多分类模型构建后,引入SHAP值对构建的产地鉴别模型进行解释。结论 SHAP特征重要性的排序揭示了变量在实际构建出的模型的重要程度。可解释预测模型在增加产地预测模型的透明度的同时,又能保持原模型的判别正确率。该研究为产地鉴别模型的构建提供了一定的启示,也为客观产地鉴别提供了参考。 展开更多
关键词 黄芪 产地鉴别 仿生技术 反向传播神经网络 shap 可解释机器学习
下载PDF
基于卷积神经网络的液化预测模型及可解释性分析
20
作者 龙潇 孙锐 郑桐 《岩土力学》 EI CAS CSCD 北大核心 2024年第9期2741-2753,共13页
常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上... 常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上覆应力、门槛加速度、循环剪应力比、剪切波速、震级与地表峰值加速度11个液化特征建立卷积神经网络(convolutional neural network,简称CNN)模型。引入边界合成少数过采样技术消除不平衡数据集的影响。将CNN模型与随机森林模型、逻辑回归模型、支持向量机模型、极致梯度提升模型和规范方法进行对比,并结合沙普利加性解释(SHapley Additive exPlanations,简称SHAP)分析输入特征对预测结果的影响趋势。结果表明,CNN模型准确率达92.58%,各项指标均优于其他4种机器学习模型和规范方法。对SHAP结果分析可知,修正标贯击数小于15的土层液化概率较高,循环剪应力比CSR小于0.25的土层更不易液化。各因素的影响规律均符合现有认知,预测模型合理可靠。 展开更多
关键词 机器学习 液化预测 卷积神经网络 边界合成少数过采样技术 沙普利加性解释(shap)
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部