期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
基于Shapley additive explanations(SHAP)分析乳腺X线检查假阴性乳腺癌的特征 被引量:1
1
作者 杨蔚 张宁妹 +1 位作者 张朝林 尹清云 《中国医学计算机成像杂志》 CSCD 北大核心 2023年第3期271-276,共6页
目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险... 目的:基于Shapley additive explanations(SHAP)分析乳腺X线摄影(MG)检查假阴性乳腺癌的特征。方法:回顾性收集我院2018年1月—2022年5月首诊乳腺癌患者,评估临床病理和影像学表现。通过logistic回归分析确定MG假阴性乳腺癌的独立危险因素。应用SHAP分析各独立危险因素的贡献价值。结果:1505个病灶纳入研究,MG假阴性乳腺癌373个。较小的病灶、致密或不均匀致密的MG密度、无可疑钙化、非肿块样强化(NME)、原位癌和腋窝淋巴结阴性与MG假阴性乳腺癌独立相关,上述参数构建的联合模型具有良好的预测效能(AUC=0.871)。根据SHAP分析,病灶大小、MG密度和病灶MRI强化类型是导致MG假阴性的主要因素;钙化状态、病理类型和腋窝淋巴结状态是重要补充。结论:MG假阴性乳腺癌具有一定的特征,此类患者需补充乳腺MRI检查以提高癌灶的检出率。 展开更多
关键词 乳腺肿瘤 X线摄影 磁共振成像 假阴性 shap
下载PDF
Investigation of feature contribution to shield tunneling-induced settlement using Shapley additive explanations method 被引量:8
2
作者 K.K.Pabodha M.Kannangara Wanhuan Zhou +1 位作者 Zhi Ding Zhehao Hong 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2022年第4期1052-1063,共12页
Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the sett... Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the settlement caused by tunneling.However,well-performing ML models are usually less interpretable.Irrelevant input features decrease the performance and interpretability of an ML model.Nonetheless,feature selection,a critical step in the ML pipeline,is usually ignored in most studies that focused on predicting tunneling-induced settlement.This study applies four techniques,i.e.Pearson correlation method,sequential forward selection(SFS),sequential backward selection(SBS)and Boruta algorithm,to investigate the effect of feature selection on the model’s performance when predicting the tunneling-induced maximum surface settlement(S_(max)).The data set used in this study was compiled from two metro tunnel projects excavated in Hangzhou,China using earth pressure balance(EPB)shields and consists of 14 input features and a single output(i.e.S_(max)).The ML model that is trained on features selected from the Boruta algorithm demonstrates the best performance in both the training and testing phases.The relevant features chosen from the Boruta algorithm further indicate that tunneling-induced settlement is affected by parameters related to tunnel geometry,geological conditions and shield operation.The recently proposed Shapley additive explanations(SHAP)method explores how the input features contribute to the output of a complex ML model.It is observed that the larger settlements are induced during shield tunneling in silty clay.Moreover,the SHAP analysis reveals that the low magnitudes of face pressure at the top of the shield increase the model’s output。 展开更多
关键词 feature Selection Shield operational parameters Pearson correlation method Boruta algorithm shapley additive explanations(shap) analysis
下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:1
3
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 shap 模型可解释性
下载PDF
基于CatBoost-SHAP模型的滑坡易发性建模及可解释性
4
作者 曾韬睿 王林峰 +2 位作者 张俞 程平 吴帆 《中国地质灾害与防治学报》 CSCD 2024年第1期37-50,共14页
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分... 文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计,进一步划分为4,6,8,12,16,20级。随后,引入了类别增强提升树模型(CatBoost)以评估不同工况下的滑坡易发性值,再结合受试者曲线与沙普利加性解释法分析,对建模过程中的不确定性和可解释性进行了深入研究,目的在于确定最优建模策略。结果表明:(1)在CatBoost模型计算中,河流距离成为最关键的影响因子,其次是与地质条件、人类活动相关的因子;(2)不分级工况下,模型能够获得最高的AUC值,达到0.866;(3)相较于等间距法,自然断点法的划分策略展现出更佳的泛化能力,且模型预测性能随着分级数量的增加而增加;(4)沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解,提高滑坡预测的准确性和可靠性,为相关地区的防灾减灾工作提供科学依据。 展开更多
关键词 滑坡 易发性建模 可解释性 CatBoost模型 沙普利加性解释法模型 台风诱发滑坡
下载PDF
基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型 被引量:3
5
作者 陈曦泽 贾俊峰 +2 位作者 白玉磊 郭彤 杜修力 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第6期1061-1070,共10页
为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV... 为了可靠、准确地预测钢管混凝土(CFST)柱的轴向承载力,建立和解释集成机器学习的CFST柱轴向承载力预测模型.使用马氏距离评估CFST柱数据库质量,通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型,使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合.采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较.使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释.结果表明,经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能,且SHAP方法能够有效地解释XGBoost模型的输出. 展开更多
关键词 钢管混凝土(CFST)柱 轴向承载力 极限梯度提升(XGBoost) 超参数优化 shap 可解释性
下载PDF
山区公路交叉口驾驶避险决策行为特性分析
6
作者 秦雅琴 包丽馨 +2 位作者 陈亮 勾钰 王锦锐 《安全与环境学报》 CAS CSCD 北大核心 2024年第6期2295-2304,共10页
为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾... 为研究驾驶特征指标与驾驶避险行为决策的关联规则以提升驾驶安全,将驾驶避险决策行为划分为纵向“停车避险”和横向“转向避险”,并运用驾驶模拟系统构建12种山区公路交叉口交通冲突虚拟场景,招募38名驾驶人进行试验,采集车辆特征和驾驶人扫视、眨眼、注视等眼动特征数据。基于随机森林构建驾驶避险决策行为模型,然后引入沙普利加和解释(SHapley Additive exPlanation, SHAP)框架进一步分析车辆、眼动特征与驾驶避险行为之间的非线性关系。结果表明:模型对纵、横向避险行为预测的准确率分别为84.77%、94.70%;纵向速度标准差、扫视持续时间标准差、轨迹偏差标准差、侧向速度标准差与驾驶避险决策行为存在明显关联,如纵向速度标准差过大(约大于10 km/h),纵向“停车避险”可能性明显增加。 展开更多
关键词 安全工程 驾驶避险 决策行为 驾驶模拟 分类预测 沙普利加和解释(shap)
下载PDF
页岩油水平井产量影响因素分析及压裂参数优化决策
7
作者 刘巍 曹小朋 +2 位作者 胡慧芳 程紫燕 卜亚辉 《油气藏评价与开发》 CSCD 北大核心 2024年第5期764-770,778,共8页
济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平... 济阳坳陷页岩在沙三下亚段和沙四上亚段等主要产层获得重大突破,但开发时间短,存在单井产量差异较大,产量主控因素尚不明确的问题,深入分析页岩油水平井高产主控因素、优化确定合理压裂工艺参数仍是目前研究的重点。为明确各因素对水平井产量的影响,基于矿场实际数据开展因素关联性分析和规律挖掘。利用灰色关联分析方法及主成分分析方法定量计算页岩油水平井生产90 d、180 d和270 d的平均日产油量与压裂液用量、加砂量等影响因素之间的相关性,并在此基础上建立页岩油产能预测模型,结合SHAP算法对压裂参数进行优化分析。结果表明:压裂液用量、加砂量和破裂事件数是影响产量的主要工程参数,灰质含量、总有机碳含量和页岩孔隙性是影响产量的主要地质参数;随着生产时间的延长,地质因素对产量的影响逐渐增强,工程因素对产量的影响逐渐减弱;压裂参数优化分析确定了40~45 m压裂段长,2700 m3单段压裂液用量,180 m3单段加砂量为最佳压裂施工参数,为页岩油水平井的开发决策和压裂设计提供了新的技术思路。 展开更多
关键词 水平井产量 影响因素分析 灰色关联分析 shap算法 页岩油
下载PDF
急性心肌梗死合并肾功能不全患者主要不良心脑血管事件风险预测模型构建
8
作者 韩福生 田雪 +1 位作者 米玉红 何华 《中国医药》 2024年第7期975-979,共5页
目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集... 目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集患者一般特征、生命体征、合并症和实验室检查结果等临床资料。采用简单随机抽样法按80%∶20%将研究对象分为训练集(592例)和测试集(148例),采用逻辑回归、随机森林、极限梯度提升(XGBoost)、支持向量机和深度神经网络5种机器学习算法分别构建MACCE的预测模型。采用受试者工作特征曲线下面积(AUC)评估模型的可靠性,选择最优模型。使用Shapley加性解释算法评估特征影响并进行特征选择构建最终模型。结果740例AMI合并肾功能不全患者中有473例(63.9%)发生MACCE。XGBoost模型的AUC最大(AUC=0.862)。在根据特征重要性等级对特征进行减少后,建立了具有5个特征的可解释的最终XGBoost模型。最终的模型可以在内部验证中准确预测MACCE发生(AUC=0.955),其中影响XGBoost模型重要临床特征分别为血尿酸、白蛋白、糖化血清白蛋白,体重和血小板计数。结论基于机器学习算法的5种模型中XGBoost模型预测AMI合并肾功能不全患者发生MACCE效果最佳。 展开更多
关键词 急性心肌梗死 肾功能不全 机器学习 主要不良心脑血管事件 shapley加性解释算法
下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
9
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
下载PDF
利用改进XGBoost模型预测和分析湿地潜流带地下水中硝态氮含量
10
作者 周念清 夏明锐 +3 位作者 陆帅帅 郭梦申 王在艾 赵文刚 《上海国土资源》 2024年第2期41-47,共7页
湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包... 湿地潜流带是地下水中氮循环的重要场所,以洞庭湖湿地潜流带为研究对象,探讨地下水中氮素迁移转化影响因素与作用机制。在湘江入湖口湿地设置了4个剖面共16口监测孔,进行了为期一个水文年的地下水取样与测试分析。研究选定的特征参数包括氧化还原电位(Eh)、溶解氧(DO)、水温(T)、地下水位(H)及埋深、酸碱度(pH)以及溶解有机碳(DOC)等。利用XGBoost方法建立机器学习模型,用于预测硝态氮的相对浓度,并通过贝叶斯优化(BO)、麻雀搜索算法(SSA)、粒子群算法(PSO)分别对XGBoost预测模型进行超参数优化,得到最佳XGBoost预测模型(BO-XGBoost)。在此基础上,采用SHAP(SHapley Additive exPlanations)方法对BO-XGBoost模型进行可解释性分析。研究结果表明,BO-XGBoost模型的性能最好,在训练集与测试集的决定系数均超过0.90;可解释性分析结果和相关分析都揭示了Eh、DO、T、H、pH和DOC等影响因子对湿地潜流带地下水中硝态氮含量的影响是逐渐降低的规律。 展开更多
关键词 湿地潜流带 硝态氮 机器学习 XGBoost shap
下载PDF
基于机器学习的带被动阻尼直流微电网系统的稳定性检测
11
作者 刘笑 杨建 +2 位作者 李力 董密 宋冬然 《电工技术学报》 EI CSCD 北大核心 2024年第8期2281-2293,2324,共14页
直流微电网中恒功率负荷(CPL)具有负阻尼特性,该特性会降低系统稳定性。为此,通过在滤波器上添加被动阻尼来增强直流微电网系统的稳定性,并提出一种基于机器学习的方法来检测带被动阻尼直流微电网系统的稳定性。首先,建立带被动阻尼直... 直流微电网中恒功率负荷(CPL)具有负阻尼特性,该特性会降低系统稳定性。为此,通过在滤波器上添加被动阻尼来增强直流微电网系统的稳定性,并提出一种基于机器学习的方法来检测带被动阻尼直流微电网系统的稳定性。首先,建立带被动阻尼直流微电网系统的小信号模型,以此来确定影响系统稳定性的参数。其次,以所选系统参数为变量建立仿真场景,以此来获取用于机器学习算法训练的数据集。再次,提出一种基于轻量型梯度提升机(LGBM)的直流微电网稳定性检测模型,并采用沙普利加解释法(SHAP)分析所选参数对LGBM预测结果和直流微电网系统稳定性的影响。最后,通过仿真和硬件在环实验验证所提方法的有效性和优越性。 展开更多
关键词 直流微电网 稳定性检测 被动阻尼 轻量型梯度提升机 沙普利加解释
下载PDF
基于随机森林法的山核桃林地土壤速效养分含量空间分布特征研究
12
作者 凌晓丹 王罗其 +3 位作者 赵科理 傅伟军 叶正钱 丁立忠 《生态学报》 CAS CSCD 北大核心 2024年第2期662-675,共14页
土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机... 土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机森林(RF)、普通克里格(OK)和Shapley加性解释(SHAP)方法,结合地形因子、气候因子、土壤因子、遥感因子等环境变量,对山核桃林地土壤碱解氮(AN)、有效磷(AP)、速效钾(AK)的空间分布特征进行分析。研究结果表明:相比于OK模型,基于环境协变量所构建的RF模型对AN、AP和AK含量空间分布预测表现最佳,R^(2)分别为0.68、0.60和0.64,均方根误差(RMSE)分别为20.005、10.287和22.426,平均绝对误差(MAE)分别为15.425、7.709和21.628。RF模型SHAP分析显示,AN和AK含量分布主要受土壤有机质(SOM)的影响,并且SOM与AN和AK存在正相关性;AP主要受pH的影响,其次为色调指数,AP与pH和色调指数均具有负相关性;AK和AP同时受到海拔和坡向的影响。两种模型预测的氮磷钾空间分布趋势总体相似,不同速效养分存在明显的空间异质性。碱解氮高值区域主要分布于研究区东部;有效磷高值区域主要分布于研究区西部,但分散度高;速效钾高值区域则主要分布于研究区中部。总体而言,基于随机森林模型可以高精度模拟山核桃林地土壤氮磷钾含量空间分布特征,并依据主要环境协变量对土壤氮磷钾的影响关系,提出相应改良措施。在有效磷含量低值区域可以施用石灰来缓解土壤酸化,同时补追磷肥;碱解氮含量高值区域可以合理减少氮肥施用;速效钾含量低值区域合理施加钾肥;对于海拔较高及迎风坡多降雨的区域,可以构建林下高效水土保持植被,减轻水土流失;在林地施用有机肥料,改善土壤理化性质,增加土壤养分含量。 展开更多
关键词 山核桃林地 随机森林 shapley加性解释 速效养分
下载PDF
基于校准窗口集成与耦合市场特征的可解释双层日前电价预测
13
作者 刘慧鑫 沈晓东 +3 位作者 魏泽涛 刘友波 刘俊勇 白元宝 《中国电机工程学报》 EI CSCD 北大核心 2024年第4期1272-1285,I0003,共15页
随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在... 随着电力市场之间耦合程度不断加深,只局限于单个市场内部的传统特征集不足以支撑高精度预测的需求。而且模型预测性能对校准窗口的选择敏感,而传统电价预测仅使用一个固定时间长度的数据集,同时预测模型的“黑盒”结构导致预测结果在工程应用中可信度偏低。针对上述问题,该文提出一种考虑校准窗口集成与耦合市场特征的可解释双层日前电价预测框架。内层框架为基于改进自适应噪声完备集合经验模态分解(improved complete ensemble empirical mode decomposition,ICEEMDAN)的择优预测,首先分解原始电价序列,然后应用Lasso估计回归(lassoestimated autoregressive,LEAR)、长期和短期时间序列网络(long-term and short-term time-series networks,LSTNet)、卷积神经网络-长短记忆神经网络(convolutionalneuralnetworks-longshort termmemory,CNN-LSTM)、移动平均(autoregressive integrated moving average,ARIMA)和核极限学习机(kernel extreme learning machines,KELM)模型预测子序列并选择最优预测算法。外层框架为基于贝叶斯模型平均(bayes modelaveraging,BMA)的校准窗口集成预测,针对每个不同校准窗口长度数据集下的预测分配权重并集成得到预测电价。最后,通过可解释方法沙普利加性解释模型(shapley additiveexplanations,SHAP)分析耦合市场特征如何影响预测电价。该文通过北欧电力市场数据集的算例分析证明了所提算法的优越性和校准窗口集成方案的有效性。 展开更多
关键词 校准窗口集成 耦合市场特征 双层预测框架 改进自适应噪声完备集合经验模态分解(ICEEMDAN) 贝叶斯模型平均(BMA) 沙普利加性解释模型(shap)
下载PDF
基于卷积神经网络的液化预测模型及可解释性分析
14
作者 龙潇 孙锐 郑桐 《岩土力学》 EI CAS CSCD 北大核心 2024年第9期2741-2753,共13页
常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上... 常规液化判别方法通常是半经验方法,存在人为因素干扰,成功率及均衡性不佳。现有的机器学习方法缺乏足够的样本支撑,存在一定的局限性。通过整合液化数据集,选取修正标准贯击数、细粒含量、土层深度、地下水位深度、总上覆应力、有效上覆应力、门槛加速度、循环剪应力比、剪切波速、震级与地表峰值加速度11个液化特征建立卷积神经网络(convolutional neural network,简称CNN)模型。引入边界合成少数过采样技术消除不平衡数据集的影响。将CNN模型与随机森林模型、逻辑回归模型、支持向量机模型、极致梯度提升模型和规范方法进行对比,并结合沙普利加性解释(SHapley Additive exPlanations,简称SHAP)分析输入特征对预测结果的影响趋势。结果表明,CNN模型准确率达92.58%,各项指标均优于其他4种机器学习模型和规范方法。对SHAP结果分析可知,修正标贯击数小于15的土层液化概率较高,循环剪应力比CSR小于0.25的土层更不易液化。各因素的影响规律均符合现有认知,预测模型合理可靠。 展开更多
关键词 机器学习 液化预测 卷积神经网络 边界合成少数过采样技术 沙普利加性解释(shap)
下载PDF
基于逐步特征增广梯度提升的暂态功角稳定评估及可解释性分析
15
作者 刘旭 刘颂凯 +3 位作者 杨超 张磊 段雨舟 晏光辉 《现代电力》 北大核心 2024年第5期844-853,共10页
基于数据驱动的电力系统暂态功角稳定评估虽然可以提供较为准确的结果,但其评估结果缺乏可解释性,导致难以应用于工程实际中。针对该问题,提出一种基于逐步特征增广梯度提升(gradient boosting enhanced with step-wise feature augment... 基于数据驱动的电力系统暂态功角稳定评估虽然可以提供较为准确的结果,但其评估结果缺乏可解释性,导致难以应用于工程实际中。针对该问题,提出一种基于逐步特征增广梯度提升(gradient boosting enhanced with step-wise feature augmentation,AugBoost)的暂态功角稳定评估及可解释性分析方法。首先,通过训练AugBoost评估模型,建立电力系统输入特征与暂态功角稳定指标之间的映射关系;其次,将相量测量单元的实时量测数据传输到训练好的AugBoost评估模型中,提供实时评估结果;并根据沙普利值加性解释(Shapley additive explanations,SHAP)模型对评估结果和输入特征之间的关系进行解释,提高结果的可信度。最后,设计模型更新过程来提升评估模型面对电力系统运行工况变化的鲁棒性。在电力系统仿真软件PSS/E提供的23节点系统和1648节点系统上的仿真结果验证了所提方法的有效性。 展开更多
关键词 暂态功角稳定评估 逐步特征增广梯度提升 沙普利值加性解释 可解释性分析 模型更新
下载PDF
基于机器学习构建急性心力衰竭患者易损期死亡或再入院风险预测模型
16
作者 曾竟 何小龙 +5 位作者 胡华娟 罗晓宇 郭志念 陈运龙 王敏 王江 《陆军军医大学学报》 CAS CSCD 北大核心 2024年第7期738-745,共8页
目的应用不同机器学习算法构建急性心力衰竭(acute heart failure,AHF)患者易损期死亡或再入院的风险预测模型,并筛选出最优模型。方法选取2019年10月至2021年7月于陆军军医大学第二附属医院心血管内科住院治疗的651例AHF患者为研究对象... 目的应用不同机器学习算法构建急性心力衰竭(acute heart failure,AHF)患者易损期死亡或再入院的风险预测模型,并筛选出最优模型。方法选取2019年10月至2021年7月于陆军军医大学第二附属医院心血管内科住院治疗的651例AHF患者为研究对象,收集入院生命体征、合并症和实验室检查结果等临床资料。复合终点事件定义为AHF患者出院后3个月内发生全因死亡或心衰加重再入院。采用简单随机抽样法将研究对象按8∶2拆分为训练集(521例)和测试集(130例),基于逻辑回归(logistic regression,LR)、随机森林(random forest,RF)、决策树(decision tree,DT)、轻量梯度提升(light gradient boosting machine,LGBM)、极端梯度提升(extreme gradient boosting,XGBoost)和神经网络(neural network,NN)6种机器学习算法分别构建预测模型。采用受试者工作特征曲线(receiver operating characteristic,ROC)和临床决策曲线(decision curve analysis,DCA)对模型的预测性能和临床获益进行评价,使用Shapley加性解释(Shapley additive explanation,SHAP)算法评估不同临床特征对模型的影响。结果651例AHF患者中发生复合终点事件203例(31.2%)。ROC曲线分析显示,LR、RF、DT、LGBM、XGBoost和NN模型的曲线下面积(area under curve,AUC)依次为0.707、0.756、0.616、0.677、0.768、0.681,XGBoost模型的AUC最高,DCA曲线中XGBoost模型的临床决策净获益也更大,整体预测效能最佳。SHAP算法分析得出,影响XGBoost模型输出结果的重要临床特征分别为血清尿酸、D-二聚体、平均动脉压、B型利钠肽、左房前后径、体质量指数和NYHA分级。结论XGBoost模型预测急性心力衰竭患者易损期死亡或再入院风险效果最佳。 展开更多
关键词 急性心力衰竭 易损期 机器学习 预测模型 shapley加性解释算法
下载PDF
基于强化学习的混合元启发式暂态电压稳定特征选择方法及可解释性研究 被引量:1
17
作者 甄永赞 阮程 《电网技术》 EI CSCD 北大核心 2024年第4期1519-1531,I0043,共14页
新型电力系统发展背景下,使用有效的特征选择方法来提取与暂态电压稳定强相关的关键响应特征,对研究暂态电压失稳机理与系统潜在安全隐患具有重要意义。为此,提出一种基于改进过滤法与混合元启发式包装法的复合框架进行特征选择的新方... 新型电力系统发展背景下,使用有效的特征选择方法来提取与暂态电压稳定强相关的关键响应特征,对研究暂态电压失稳机理与系统潜在安全隐患具有重要意义。为此,提出一种基于改进过滤法与混合元启发式包装法的复合框架进行特征选择的新方法。基于对称不确定性值改进的最大相关最小冗余性准则进行特征粗筛;将Q学习强化学习融合至元启发式优化算法中,并采用开发探索折衷策略以增强特征细选能力,获取最优关键响应特征子集。在此基础上,采用沙普利值加性解释归因理论综合分析各筛选特征对暂态电压稳定的影响与系统薄弱环节。新型电力系统算例验证了所提方法的有效性。 展开更多
关键词 暂态电压稳定 特征选择 强化学习 混合元启发式 沙普利值加性解释
下载PDF
基于可解释性机器学习模型的轻型缺血性卒中复发预测研究
18
作者 莫秋红 丁晓波 +2 位作者 李靓 张岩波 李伟荣 《中国卒中杂志》 北大核心 2024年第8期924-930,共7页
目的利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素。方法回顾性收集2020年7—12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因... 目的利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素。方法回顾性收集2020年7—12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因素变量筛选,合成少数过采样技术-标称连续处理数据不平衡,数据集按8∶2的比例分为训练集与测试集,网格搜索10折交叉验证构建轻量梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machine,SVM)模型,并与逻辑回归(logistic regression,LR)模型进行比较,基于ROC的AUC、校准曲线分别评价模型的区分度与校准度,性能最好的模型通过Shapley加性解释(Shapley additive explanation,SHAP)模型对预测结果进行解读。结果本研究共纳入520例MIS患者,2年内复发93例(17.9%),测试集中LightGBM、SVM、LR预测患者2年内复发的AUC分别为0.935(95%CI 0.896~0.973)、0.833(95%CI 0.770~0.896)、0.764(95%CI 0.691~0.835),准确度分别为0.890、0.773、0.693,布里尔分数分别为0.105、0.167、0.200。结果显示LightGBM模型性能最优,基于SHAP的LightGBM可解释模型重要性前5的是舒张压、年龄、糖尿病、LDL-C、吸烟。结论本研究建立的LightGBM模型预测效果良好,可为MIS患者2年内复发的预测提供借鉴。通过SHAP可解释性帮助临床医师更好地理解预测模型结果背后的原因,对MIS患者做出更个性化与合理化的临床决策。 展开更多
关键词 轻型缺血性卒中 复发 轻量梯度提升机 shapley加性解释
下载PDF
Dynamic Forecasting of Traffic Event Duration in Istanbul:A Classification Approach with Real-Time Data Integration
19
作者 Mesut Ulu Yusuf Sait Türkan +2 位作者 Kenan Menguc Ersin Namlı Tarık Kucukdeniz 《Computers, Materials & Continua》 SCIE EI 2024年第8期2259-2281,共23页
Today,urban traffic,growing populations,and dense transportation networks are contributing to an increase in traffic incidents.These incidents include traffic accidents,vehicle breakdowns,fires,and traffic disputes,re... Today,urban traffic,growing populations,and dense transportation networks are contributing to an increase in traffic incidents.These incidents include traffic accidents,vehicle breakdowns,fires,and traffic disputes,resulting in long waiting times,high carbon emissions,and other undesirable situations.It is vital to estimate incident response times quickly and accurately after traffic incidents occur for the success of incident-related planning and response activities.This study presents a model for forecasting the traffic incident duration of traffic events with high precision.The proposed model goes through a 4-stage process using various features to predict the duration of four different traffic events and presents a feature reduction approach to enable real-time data collection and prediction.In the first stage,the dataset consisting of 24,431 data points and 75 variables is prepared by data collection,merging,missing data processing and data cleaning.In the second stage,models such as Decision Trees(DT),K-Nearest Neighbour(KNN),Random Forest(RF)and Support Vector Machines(SVM)are used and hyperparameter optimisation is performed with GridSearchCV.In the third stage,feature selection and reduction are performed and real-time data are used.In the last stage,model performance with 14 variables is evaluated with metrics such as accuracy,precision,recall,F1-score,MCC,confusion matrix and SHAP.The RF model outperforms other models with an accuracy of 98.5%.The study’s prediction results demonstrate that the proposed dynamic prediction model can achieve a high level of success. 展开更多
关键词 Traffic event duration forecasting machine learning feature reduction shapley additive explanations(shap)
下载PDF
Landslide susceptibility mapping(LSM)based on different boosting and hyperparameter optimization algorithms:A case of Wanzhou District,China
20
作者 Deliang Sun Jing Wang +2 位作者 Haijia Wen YueKai Ding Changlin Mi 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第8期3221-3232,共12页
Boosting algorithms have been widely utilized in the development of landslide susceptibility mapping(LSM)studies.However,these algorithms possess distinct computational strategies and hyperparameters,making it challen... Boosting algorithms have been widely utilized in the development of landslide susceptibility mapping(LSM)studies.However,these algorithms possess distinct computational strategies and hyperparameters,making it challenging to propose an ideal LSM model.To investigate the impact of different boosting algorithms and hyperparameter optimization algorithms on LSM,this study constructed a geospatial database comprising 12 conditioning factors,such as elevation,stratum,and annual average rainfall.The XGBoost(XGB),LightGBM(LGBM),and CatBoost(CB)algorithms were employed to construct the LSM model.Furthermore,the Bayesian optimization(BO),particle swarm optimization(PSO),and Hyperband optimization(HO)algorithms were applied to optimizing the LSM model.The boosting algorithms exhibited varying performances,with CB demonstrating the highest precision,followed by LGBM,and XGB showing poorer precision.Additionally,the hyperparameter optimization algorithms displayed different performances,with HO outperforming PSO and BO showing poorer performance.The HO-CB model achieved the highest precision,boasting an accuracy of 0.764,an F1-score of 0.777,an area under the curve(AUC)value of 0.837 for the training set,and an AUC value of 0.863 for the test set.The model was interpreted using SHapley Additive exPlanations(SHAP),revealing that slope,curvature,topographic wetness index(TWI),degree of relief,and elevation significantly influenced landslides in the study area.This study offers a scientific reference for LSM and disaster prevention research.This study examines the utilization of various boosting algorithms and hyperparameter optimization algorithms in Wanzhou District.It proposes the HO-CB-SHAP framework as an effective approach to accurately forecast landslide disasters and interpret LSM models.However,limitations exist concerning the generalizability of the model and the data processing,which require further exploration in subsequent studies. 展开更多
关键词 Landslide susceptibility Hyperparameter optimization Boosting algorithms shapley additive explanations(shap)
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部