期刊文献+
共找到454篇文章
< 1 2 23 >
每页显示 20 50 100
Shapley值及其应用
1
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 shapLEY值 权力指数 图博弈 shap方法
下载PDF
基于LightGBM与SHAP的空腔积水深度可解释性机器学习模型
2
作者 李珊珊 孙朝阳 李国栋 《力学季刊》 CAS CSCD 北大核心 2024年第2期442-453,共12页
传统的机器学习模型主要围绕如何提升模型预测精度进行研究,从而忽略了预测结果的可解释性.本研究基于LightGBM (Light Gradient Boosting Machine)建立了预测掺气设施空腔积水深度的黑箱模型,与常用的机器学习模型如RF (Random Forest)... 传统的机器学习模型主要围绕如何提升模型预测精度进行研究,从而忽略了预测结果的可解释性.本研究基于LightGBM (Light Gradient Boosting Machine)建立了预测掺气设施空腔积水深度的黑箱模型,与常用的机器学习模型如RF (Random Forest)、SVM (Support Vector Machine)及XGBoost (Extreme Gradient Boosting)对比结果表明LightGBM拥有较高的预测精度.进一步通过贝叶斯优化技术对LightGBM的四个超参数进行优化,较大程度上提升了模型的R^(2)(决定系数)得分.应用SHAP (Shapley Additive Explanation)事后解释方法对LightGBM的预测结果进行全局解释和局部解释.全局解释结果表明:流速、水舌冲击角、坎高及流量是影响空腔积水形成的主要因素,特征交互解释可以用来解释特征之间的复杂非线性关系,局部解释则可以显示单个样本各特征的影响大小.研究建立的基于LightGBM-SHAP的空腔积水深度可解释性机器学习模型在掺气设施体型优化及模型试验方案优化方面有很好的应用前景. 展开更多
关键词 可解释性机器学习 空腔积水 贝叶斯优化 LightGBM shap
下载PDF
基于XGBOOST-SHAP的地铁建成环境与站点出行距离的非线性关系研究 被引量:4
3
作者 李培坤 陈旭梅 +3 位作者 鲁文博 马嘉欣 刘屹 王昊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第4期1624-1633,共10页
相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境... 相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境、站点自身属性等方面构建11种建成环境指标,建立基于极端梯度提升的XGBOOST-SHAP归因分析架构的可解释性机器学习模型,以揭示两者之间的非线性关系。同时,将该模型拟合回归效果与梯度提升决策树(GBDT)及最小二乘回归(OLS)进行比较,以验证XGBOOST模型在拟合回归效果上的优势。结果表明:XGBOOST模型的R方、平均绝对误差(MAE)、均方误差(MSE)值分别为0.75、0.95、1.36,其拟合效果要优于GBDT与OLS模型。站点平均出行距离呈现出明显的环状分布的空间异质性。SHAP归因分析结果表明:距市中心距离特征贡献最大,路网密度、土地利用混合度、公交线路数量以及住宅数量对出行距离的贡献度也相对较高;POI香农熵指数、餐饮服务点对平均出行距离的正负反馈不明显;其余指标对平均出行距离的影响均呈现出正负反馈机制结合的趋势。研究结果对交通需求分析、线路容量优化、运营效果评估等提供了数据支撑,可有效提高地铁交通便利性,满足不同区域的出行需求并改善整个地铁系统的效率和可持续性。 展开更多
关键词 地铁站点 建成环境 出行距离 XGBOOST模型 shap归因分析 非线性关系
下载PDF
基于不同因子筛选方法的LightGBM-SHAP滑坡易发性研究 被引量:3
4
作者 陈丹璐 孙德亮 +1 位作者 文海家 辜庆渝 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期148-158,共11页
以重庆市黔江区为例,选取23个评价因子构建滑坡致灾因子数据库,利用地理探测器与皮尔逊-主成分分析2种因子筛选方法选择因子最优组合;基于Bayesian-LightGBM-SHAP混合模型进行滑坡易发性评价,并对模型精度进行验证,分析影响黔江区滑坡... 以重庆市黔江区为例,选取23个评价因子构建滑坡致灾因子数据库,利用地理探测器与皮尔逊-主成分分析2种因子筛选方法选择因子最优组合;基于Bayesian-LightGBM-SHAP混合模型进行滑坡易发性评价,并对模型精度进行验证,分析影响黔江区滑坡发生的主导因子.初始模型的AUC值为0.801,Pearson Correlation Coefficient-BayesianLightGBM模型AUC值为0.824,GeoDetector-Bayesian-LightGBM模型AUC为0.835;由因子重要性可知,多年平均降雨量、高程、POI核密度与距河流距离是滑坡发生的最主要因子,而输沙指数、水流动力指数与坡位对滑坡的发生影响较弱.因子筛选法-Bayesian-LightGBM相结合的混合模型能够提高模型的准确性,为构建合理因子数据库提供参考框架;通过与因子重要性的结合分析,验证了地理探测器能够准确探测各因子对滑坡发生的贡献值,突出各滑坡地理因子组合之间的相关性,从而探究各因子与滑坡之间的关系. 展开更多
关键词 滑坡易发性区划 地理探测器 皮尔逊相关系数 主成分分析 贝叶斯优化 LightGBM shap
下载PDF
基于SHAP可解释性的焊缝缺陷类型超声识别XGBoost模型 被引量:1
5
作者 陈明良 马志远 +3 位作者 张东辉 付冬欣 廖静瑜 林莉 《无损检测》 CAS 2024年第6期36-42,共7页
针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16... 针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16个时域特征、16个频域特征以及3个信息熵特征。计算SHAP值并选择其前8个高贡献特征构建特征子集,利用交叉验证和网格搜索优化XGBoost模型进行缺陷识别。试验结果表明,4种缺陷识别的平均准确率为96.7%;其中,横通孔的识别效果最佳,精确率、召回率和F_(1-score)均达到100%,三角槽次之,方形槽略差,矩形槽的识别结果最差,其精确率、召回率和F_(1-score)均为93.3%。最后,讨论了高贡献特征与缺陷类别之间的相关性,并对特征贡献差异及其原因进行了分析。 展开更多
关键词 超声检测 缺陷分类 XGBoost模型 特征选择 shap
下载PDF
基于HA-RF-SHAP的露天煤矿粉尘浓度预测模型 被引量:1
6
作者 金磊 杨晓伟 +4 位作者 张浩 杜勇志 李新鹏 戴春田 周伟 《西安科技大学学报》 CAS 北大核心 2024年第1期74-83,共10页
为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模... 为了有效预测和控制煤矿粉尘浓度,保障煤矿工人健康及环境安全,以宝日希勒露天煤矿现场粉尘监测数据为基础,使用随机森林对粉尘浓度进行预测,提出了4种启发式智能优化算法优化随机森林超参数的方法,通过RMSE、MAE和皮尔逊相关系数R对模型进行评价,采用SHAP可解释模型分析影响露天煤矿粉尘浓度的因素。结果表明:PM2.5、PM10、TSP的最优模型分别为GWO-RF、WOA-RF和HHO-RF;超参数调整使模型整体RMSE指标提升约为1~3,MAE提升约为1~2.5,R提升约4%~6%;PM2.5的预测表现最好,训练集与测试集共同作用时,R为0.9463,MAE为3.059,RMSE为4.919,其次是PM10、TSP;单因素作用时,湿度对于该矿粉尘浓度影响最大,双因素同时影响下湿度和气压对粉尘浓度变化影响最大。研究提供了一个有效的粉尘浓度预测方法,可准确预测粉尘浓度并确定粉尘最影响因素,对矿山粉尘管控具有重要参考价值。 展开更多
关键词 露天煤矿 粉尘浓度预测 启发式算法 shap 模型可解释性
下载PDF
基于机器学习和SHAP算法的农业用水量预测模型构建
7
作者 昝子懿 岳卫峰 +5 位作者 赵航正 曹倡铭 胡竞丹 胡立堂 徐洋 陈爱萍 《节水灌溉》 北大核心 2024年第12期102-110,共9页
农业用水预测是区域水资源规划中的关键环节,对于实现水资源合理开发,保障粮食安全具有重要的指导意义。然而,现有农业用水预测模型普遍存在输入参数冗余、模型精度不够等问题,不利于有效地进行水资源管理和优化决策。因此,选择内蒙河... 农业用水预测是区域水资源规划中的关键环节,对于实现水资源合理开发,保障粮食安全具有重要的指导意义。然而,现有农业用水预测模型普遍存在输入参数冗余、模型精度不够等问题,不利于有效地进行水资源管理和优化决策。因此,选择内蒙河套灌区作为研究对象,首先对灌区农业用水量相关驱动因子进行主成分分析(Principal Components Analysis,简称PCA),筛选出影响灌区农业用水量的关键因子;其次构建多种基于机器学习的农业用水预测模型;最后,利用Shapley加法解释方法(SHapley Additive exPlanations,SHAP)验证最优模型应用的合理性,并深入挖掘各特征值对农业用水量的贡献影响。结果表明:多层感知器神经网络(MLP)机器学习模型可以有效的预测农业用水量,其R2评价指标为0.84,相较于其他五种不同机器学习模型(最小绝对收缩和选择算子回归Lasso、岭回归Ridge、决策树DT、随机森林RF、极限梯度提升XGboost),该模型预测结果较好。采用SHAP值法对MLP机器学习模型中的输入参数进行量化分析,发现第一产业总产值与粮食产量有较高的绝对平均SHAP值,而在不同灌域中SHAP值贡献大小略有差异。构建农业用水量预测筛选模型可以准确预测农业用水量,从而实现灌区农业精准灌溉并提高水资源利用效率,对于缓解未来河套灌区水资源供需矛盾具有重要的实际意义。 展开更多
关键词 农业用水量 机器学习 用水量预测 shap 河套灌区
下载PDF
采用XGBoost+SHAP揭示贵阳市地表温度的驱动力因子
8
作者 吴雪 张显云 +3 位作者 龙安成 刘晶晖 杨正雄 任明亚 《环境科学与技术》 CAS CSCD 北大核心 2024年第8期155-166,共12页
该文在基于数理统计方法揭示贵阳市地表温度(land surface temperature,LST)年际和季节时空演变趋势的基础上,为更好地明晰影响因子及其交互影响对LST的驱动作用,协同极端梯度提升算法(extreme gradient boosting,XGBoost)和Shapley加... 该文在基于数理统计方法揭示贵阳市地表温度(land surface temperature,LST)年际和季节时空演变趋势的基础上,为更好地明晰影响因子及其交互影响对LST的驱动作用,协同极端梯度提升算法(extreme gradient boosting,XGBoost)和Shapley加法解释方法(shapley additive explanations,SHAP),对贵阳市LST时空演变模式背后的原因进行了诊断分析。结果表明:(1)2000-2020年间,贵阳市秋季低温区面积占比呈显著减少趋势,年均减少率约为0.068%。(2)LST增温表现出南高北低的分布特征,云岩区和南明区的亚高温区和高温区变化最为明显。(3)XGBoost可较好地刻画各季节LST与影响因子间的响应关系,获得了较高的建模精度。所构建模型在测试集上的RMSE、MAE和R^(2)分别为0.5169℃、0.3893℃和0.8950。(4)基于SHAP的分析结果表明:影响因子对LST影响的重要性存在季节差异,总体而言,国内生产总值(GDP)、高程、降水和植被覆盖对LST的影响最大;除GDP和人口密度外,各影响因子对LST变化的作用方式主要为非线性关系;高程、降水、植被和水体对研究区LST主要起到降温作用,而不透水面、裸地、农业用地、人口密度及GDP则主要起到增温作用。 展开更多
关键词 地表温度 时空演变 影响因子 XGBoost shap
下载PDF
基于随机森林模型与SHAP算法的渝东北烟区土壤交换酸含量影响因素分析研究
9
作者 李昕容 杨超 +2 位作者 张鑫 周亚男 刘洪斌 《中国烟草学报》 CAS CSCD 北大核心 2024年第2期52-60,共9页
【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483... 【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483个采样点的土壤交换酸数据进行统计分析,构建随机森林(Random Forest, RF)模型并结合Shapley Additive exPlanations(SHAP)算法,探讨影响土壤交换酸含量的主控因素。【结果】(1)研究区土壤交换酸含量在1.56~27.50 cmol/kg之间,与降水、日照时数、坡向、种植年限呈极显著负相关性。二叠系石灰岩发育的土壤交换酸含量显著高于三叠系石灰岩发育的土壤。(2)RF模型可解释土壤交换酸含量空间变异的64%,影响因子对土壤交换酸含量的重要性为气候>成土母岩>种植年限>地形。(3)SHAP算法揭示了土壤交换酸含量在不同气候条件下存在明显的阈值效应。当年均降水量、日照时数和均温分别超过1250 mm、1290 h和12℃时,会导致土壤交换酸含量的减少,反之则会促使其增加。【结论】气候是影响土壤交换酸含量变异最重要的环境因素,其中降水和日照时数是最重要的气候因子,研究结果可为烟田土壤酸化管理调控提供参考。 展开更多
关键词 土壤交换酸 环境因子 随机森林 shap算法 阈值
下载PDF
基于AutoML-SHAP的超高性能混凝土抗压强度可解释预测
10
作者 李硕 艾丽菲拉·艾尔肯 +1 位作者 罗文波 陈锦杰 《硅酸盐通报》 CAS 北大核心 2024年第10期3634-3644,共11页
超高性能混凝土(UHPC)的抗压强度与其配比成分之间存在高度非线性的复杂关系,利用传统的统计方法难以准确预测抗压强度。为解决这一问题,本文提出一种基于自动机器学习(AutoML)技术的UHPC抗压强度预测办法,同时引入沙普利加和解释(SHAP... 超高性能混凝土(UHPC)的抗压强度与其配比成分之间存在高度非线性的复杂关系,利用传统的统计方法难以准确预测抗压强度。为解决这一问题,本文提出一种基于自动机器学习(AutoML)技术的UHPC抗压强度预测办法,同时引入沙普利加和解释(SHAP)增加其可解释性。AutoML和SHAP的集成有助于构建精确、高效且可解释的模型。结果表明,AutoML模型可自动建立,其准确性、稳健性优于基础模型。SHAP通过全局解释性分析、单样本解释分析以及特征依赖性解释分析,阐明了各个特征因素对抗压强度的影响机理,有助于UHPC抗压强度发展机制以及影响参数重要性的理解,可为UHPC的设计与应用提供参考。 展开更多
关键词 超高性能混凝土 抗压强度 机器学习 AutoML shap
下载PDF
基于XGBoost-SHAP模型的太湖流域居民生态补偿支付意愿影响因素研究
11
作者 邓梦华 张天舒 陈军飞 《水利经济》 北大核心 2024年第2期44-50,共7页
在对太湖流域居民生态补偿支付意愿调查的基础上,基于可解释机器学习模型XGBoost-SHAP分析了居民生态补偿支付意愿的影响因素,并比较了有支付意愿和没有支付意愿居民之间影响因素的差异。结果表明:影响太湖流域居民生态补偿支付意愿最... 在对太湖流域居民生态补偿支付意愿调查的基础上,基于可解释机器学习模型XGBoost-SHAP分析了居民生态补偿支付意愿的影响因素,并比较了有支付意愿和没有支付意愿居民之间影响因素的差异。结果表明:影响太湖流域居民生态补偿支付意愿最重要的3个因素为学历、收入和生态环境保护意愿;单个居民之间的支付意愿影响因素呈现一定的差异,尤其是有支付意愿和没有支付意愿居民之间的影响因素差异显著;总体而言,增强居民生态环境保护意识和加大生态补偿政策的宣传可以提升流域居民参与生态补偿的意愿。 展开更多
关键词 生态补偿 支付意愿 XGBoost shap 可解释机器学习 太湖流域
下载PDF
基于SHAP的三阴性乳腺癌可解释预测模型的建立
12
作者 刘孟昕 葛敏 +1 位作者 王世威 陆欢 《浙江临床医学》 2024年第4期487-489,共3页
目的为三阴性乳腺癌患者构建一种能够同时获得良好效果的、可解释的预测模型。方法回顾性分析136例乳腺癌患者的临床特征和多序列多参数核磁共振成像,其中三阴性乳腺癌23例,非三阴性乳腺癌113例。通过勾画提取影像组学特征进行筛选并构... 目的为三阴性乳腺癌患者构建一种能够同时获得良好效果的、可解释的预测模型。方法回顾性分析136例乳腺癌患者的临床特征和多序列多参数核磁共振成像,其中三阴性乳腺癌23例,非三阴性乳腺癌113例。通过勾画提取影像组学特征进行筛选并构建模型,最后结合放射组学特征和独立的临床图像特征,构建机器学习框架。此外,还采用为实现个性化临床决策支持提供个性化评估和解释的SHAP模型可解释器。结果经过影像组学特征筛选,11个特征参与计算影像组学评分,其在训练集与测试集的AUC为0.898、0.803。将其与临床模型结合,使预测精度进一步提高。结论多模式可解释预测模型可能会帮助临床医师更准确、更迅速识别三阴性乳腺癌风险,及时、准确为患者治疗。 展开更多
关键词 三阴性乳腺癌 磁共振 影像组学 shap算法
下载PDF
融合随机森林与SHAP的恶意加密流量预测模型 被引量:1
13
作者 吴燕 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第2期167-178,共12页
加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包... 加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包装等复杂攻击,而基于机器学习的方法也存在误报率高和决策过程难以理解的问题.为此,提出一种恶意加密流量检测高可解释性模型EPMRS,以弥补现有研究在性能与可解释性上存在的局限性.在数据去重,重编码及特征筛选等数据预处理的基础上,基于随机森林构建恶意加密流量检测模型,并与逻辑回归、KNN、LGBM等10种主流机器学习模型进行5折交叉验证的实验对比;基于SHAP框架从整体模型、核心风险特征交互效应及样本决策过程三个不同的层面,全面增强恶意加密流量检测模型的可解释性.EPMRS在MCCCU数据集的实证结果表明,EPMRS对未知加密恶意流量的检测准确率达到99.996%、误识别率为0.0003%,与已有工作相比,性能指标平均提升了0.287175%~7.513175%;同时,通过可解释性分析识别出了session(会话)、flow_duration(流持续时间)、Goodput(有效吞吐量)等为影响恶意加密流量检测的核心风险因素. 展开更多
关键词 恶意加密流量 网络安全 随机森林 shap模型 可解释性
下载PDF
基于机器学习的碳排放预测及SHAP特征分析 被引量:1
14
作者 王泽菡 陈丽娟 林心如 《科技与创新》 2024年第2期148-150,共3页
碳排放是中国乃至国际社会近年来关注的热点问题,一方面经济发展离不开碳排放,另一方面碳排放过量会使生态环境遭到破坏。因此,对碳排放作出有效预测,有助于平衡生态环境与经济发展。通过机器学习分析人口流动、温度、空气质量等特征并... 碳排放是中国乃至国际社会近年来关注的热点问题,一方面经济发展离不开碳排放,另一方面碳排放过量会使生态环境遭到破坏。因此,对碳排放作出有效预测,有助于平衡生态环境与经济发展。通过机器学习分析人口流动、温度、空气质量等特征并构建碳排放预测模型,同时引入SHAP(SHapley Additive exPlanations,夏普利值)解释模型与分析数据。结果表明,人口流动与温度对碳排放有极大影响。 展开更多
关键词 机器学习 碳排放 shap 预测
下载PDF
基于“XGBoost—SHAP”的可解释性崩塌落石风险预测在公路工程中的应用
15
作者 曹放 孙徐 张钰 《工程技术研究》 2024年第14期1-4,共4页
文章基于XGBoost与SHAP算法构建崩塌落石风险预测模型,并在省道S463改扩建为G664项目的勘察设计中加以应用。将人工智能技术与工程实践相结合,为崩塌落石的风险预测拓展了思路。此次XGBoost模型预测准确率达到了91.04%~94.12%,基本满足... 文章基于XGBoost与SHAP算法构建崩塌落石风险预测模型,并在省道S463改扩建为G664项目的勘察设计中加以应用。将人工智能技术与工程实践相结合,为崩塌落石的风险预测拓展了思路。此次XGBoost模型预测准确率达到了91.04%~94.12%,基本满足辅助工程勘察设计需求,同时利用SHAP算法对预测模型黑箱进行了解释,找到了该模型主控因子为边坡宽度、视倾角、岩性强度、坡面面积及岩层倾向—坡向夹角,同时对预测结果的影响值给出了定量分析,明确了实际工作方向。该模型准确率高,可操作性强,定量指标明确,可供类似工程实践参考。 展开更多
关键词 公路工程 XGBoost shap 崩塌落石 风险预测 人工智能 机器学习
下载PDF
基于LightGBM与SHAP的信贷违约预测方法研究
16
作者 戴峥琪 雷亿辉 +1 位作者 彭晨 夏广萍 《邵阳学院学报(自然科学版)》 2024年第1期84-91,共8页
机器学习方法在信贷领域取得了较好的成果,但由于缺乏可解释性,应用受到限制,为增加其可信度和透明度,克服“黑盒”模型缺乏可解释性的缺陷,基于LightGBM算法建立信贷违约预测模型,并设计SHAP算法对模型的结果进行解释。结果表明,模型... 机器学习方法在信贷领域取得了较好的成果,但由于缺乏可解释性,应用受到限制,为增加其可信度和透明度,克服“黑盒”模型缺乏可解释性的缺陷,基于LightGBM算法建立信贷违约预测模型,并设计SHAP算法对模型的结果进行解释。结果表明,模型性能更好,预测精度更高,其精度高达88.61%;SHAP算法解释结果表明“信用组合的分类”“要支付的剩余债务”“每月EMI付款”等因素对信贷决策有着重要影响。 展开更多
关键词 信贷风险 LightGBM算法 shap算法 可解释性
下载PDF
基于LightGBM和SHAP方法的居民投资风险偏好的实证分析
17
作者 祝起祾 苟小菊 《金融科技时代》 2024年第4期79-84,共6页
作为金融产品市场的重要客户群体,居民投资者的风险偏好在很大程度上决定了其对不同风险收益特征的金融产品的需求。文章利用LightGBM模型和SHAP方法对2017-2019年中国金融调查数据进行实证分析,基于高维特征充分挖掘居民风险偏好的影... 作为金融产品市场的重要客户群体,居民投资者的风险偏好在很大程度上决定了其对不同风险收益特征的金融产品的需求。文章利用LightGBM模型和SHAP方法对2017-2019年中国金融调查数据进行实证分析,基于高维特征充分挖掘居民风险偏好的影响因素及其影响机制。结果显示,年龄、金融素养、家庭收入和收入的跨期变动影响显著,其中年龄和金融素养的影响最为重要,年龄和居民投资风险偏好存在负向关系,而金融素养的提升会抬升风险偏好水平,收入对风险偏好的影响则较为复杂,存在非线性特征。 展开更多
关键词 机器学习 数据挖掘 LightGBM模型 风险偏好 shap方法
下载PDF
基于Shapley加性解释的ChatGPT生成文本检测模型研究
18
作者 刘冬 陈一民 《计算机应用与软件》 北大核心 2024年第10期212-220,共9页
针对如何快速识别文本内容是否为ChatGPT所生成的问题,提出一种基于BERT-BiGRU的AI生成文本检测模型。该模型使用预训练的BERT(Bidirectional Encoder Representations from Transformers)抽取文本的语义特征,并使用BiGRU(Bidirectional... 针对如何快速识别文本内容是否为ChatGPT所生成的问题,提出一种基于BERT-BiGRU的AI生成文本检测模型。该模型使用预训练的BERT(Bidirectional Encoder Representations from Transformers)抽取文本的语义特征,并使用BiGRU(Bidirectional Gated Recurrent Unit)进行特征综合提炼;将BERT-BiGRU分类模型在AI生成检测数据集HC3(Human ChatGPT Comparison Corpus)上的分类性能进行相关模型评估;引入Shapley加性解释工具(SHAP)从全局和局部两个维度对不同模型所识别出的关键特征和基准值进行比较分析。实验结果表明,虽然深度学习和预训练BERT分类模型均取得了较好的分类性能,但在未学习过语种数据集上性能下降严重,然而BERT-BiGRU模型表现优秀;不同模型使用可解释工具在同一数据集上计算得到的关键词差异较大,且关键词多为数字、生僻字和标点符号,模型并未真正理解人类撰写文本与AI生成文本的内在特征区别,基于已有封闭数据集训练得到的模型无法真正应对开放式的实际应用场景。 展开更多
关键词 ChatGPT shap BERT BiGRU HC3 AI生成文本检测
下载PDF
A Study on the Explainability of Thyroid Cancer Prediction:SHAP Values and Association-Rule Based Feature Integration Framework
19
作者 Sujithra Sankar S.Sathyalakshmi 《Computers, Materials & Continua》 SCIE EI 2024年第5期3111-3138,共28页
In the era of advanced machine learning techniques,the development of accurate predictive models for complex medical conditions,such as thyroid cancer,has shown remarkable progress.Accurate predictivemodels for thyroi... In the era of advanced machine learning techniques,the development of accurate predictive models for complex medical conditions,such as thyroid cancer,has shown remarkable progress.Accurate predictivemodels for thyroid cancer enhance early detection,improve resource allocation,and reduce overtreatment.However,the widespread adoption of these models in clinical practice demands predictive performance along with interpretability and transparency.This paper proposes a novel association-rule based feature-integratedmachine learning model which shows better classification and prediction accuracy than present state-of-the-artmodels.Our study also focuses on the application of SHapley Additive exPlanations(SHAP)values as a powerful tool for explaining thyroid cancer prediction models.In the proposed method,the association-rule based feature integration framework identifies frequently occurring attribute combinations in the dataset.The original dataset is used in trainingmachine learning models,and further used in generating SHAP values fromthesemodels.In the next phase,the dataset is integrated with the dominant feature sets identified through association-rule based analysis.This new integrated dataset is used in re-training the machine learning models.The new SHAP values generated from these models help in validating the contributions of feature sets in predicting malignancy.The conventional machine learning models lack interpretability,which can hinder their integration into clinical decision-making systems.In this study,the SHAP values are introduced along with association-rule based feature integration as a comprehensive framework for understanding the contributions of feature sets inmodelling the predictions.The study discusses the importance of reliable predictive models for early diagnosis of thyroid cancer,and a validation framework of explainability.The proposed model shows an accuracy of 93.48%.Performance metrics such as precision,recall,F1-score,and the area under the receiver operating characteristic(AUROC)are also higher than the baseline models.The results of the proposed model help us identify the dominant feature sets that impact thyroid cancer classification and prediction.The features{calcification}and{shape}consistently emerged as the top-ranked features associated with thyroid malignancy,in both association-rule based interestingnessmetric values and SHAPmethods.The paper highlights the potential of the rule-based integrated models with SHAP in bridging the gap between the machine learning predictions and the interpretability of this prediction which is required for real-world medical applications. 展开更多
关键词 Explainable AI machine learning clinical decision support systems thyroid cancer association-rule based framework shap values classification and prediction
下载PDF
基于深度生存分析与SHAP的电梯风险预测
20
作者 曾倩欣 王槃 +1 位作者 杨欢 杨勇 《计算机系统应用》 2024年第11期247-256,共10页
为解决低频、不规则时间周期的基于统计的电梯预测性维护问题,本文提出了结合深度生存分析与数据切割、补偿的综合方案.本文通过建立动态静态生存状态向量,捕捉影响大型故障风险的因素;此外,针对记录型数据中存在的左删失问题,本文采用... 为解决低频、不规则时间周期的基于统计的电梯预测性维护问题,本文提出了结合深度生存分析与数据切割、补偿的综合方案.本文通过建立动态静态生存状态向量,捕捉影响大型故障风险的因素;此外,针对记录型数据中存在的左删失问题,本文采用数据补充的方式解决,并探究不同补充方式与分割策略对深度生存模型精度的影响.最后,研究对电梯场景下的深度生存模型使用SHAP分析,揭示各因素对故障风险的动态影响.研究结果显示,采用数据粗分割与Cox填充方式组合的模型具有强预测能力和准确性, DeepSurv模型在预测能力和稳定性上表现突出,梯龄、提升高度对大型故障风险的贡献随特定条件的变化会发生转折. 展开更多
关键词 预防性维护 深度生存分析 电梯 数据删失 shap
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部