期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
小微企业违约特征再探索:基于SHAP解释方法的机器学习模型
1
作者 雷欣南 林乐凡 +1 位作者 肖斌卿 俞红海 《中国管理科学》 CSCD 北大核心 2024年第5期1-12,共12页
机器学习方法已经被应用于小微企业贷款审批和监测过程,并且在违约识别方面取得了良好效果,但是机器学习系统决策过程的不可见性导致其在违约特征识别领域未能得到进一步实际应用。基于某银行的小微企业贷款微观数据,在机器学习模型基... 机器学习方法已经被应用于小微企业贷款审批和监测过程,并且在违约识别方面取得了良好效果,但是机器学习系统决策过程的不可见性导致其在违约特征识别领域未能得到进一步实际应用。基于某银行的小微企业贷款微观数据,在机器学习模型基础上加入SHAP(SHapley Additive exPlanations)解释方法对小微企业的违约特征进行研究比较,研究兼顾了实际情境中判别准确性和指标可解释的要求。研究发现,除传统的贷款信息与企业财务指标外,违约的核心特征中企业年龄、被告案件数量以及客户经理评价“软信息”等非财务指标对于识别小微企业违约具有重要价值。本文从可解释性的角度探讨机器学习方法在小微企业违约特征识别的应用,创新性地引入SHAP解释方法研究评级中的重要指标,同时所挖掘的关键指标对贷款业务开展具有指导意义。 展开更多
关键词 小微企业 违约特征 非财务信息 shap解释方法 机器学习
原文传递
基于CatBoost模型和SHAP解释方法的土壤重金属影响因素与程度定量分析 被引量:3
2
作者 郑家桐 王鹏 +3 位作者 石航源 肖荣波 邓一荣 庄长伟 《环境科学学报》 CAS CSCD 北大核心 2023年第4期448-456,共9页
掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空... 掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空间分布的影响因子和范围边界.结果表明,CatBoost在预测土壤Cd、Pb和Cr含量上具有较高精度,R^(2)分别为0.76、0.71和0.81.空间位置对土壤Cd、Pb分布的影响分别可达71.28%和73.54%,其中,与冶炼厂的距离(DI_(Smp))是土壤Cd空间分布的关键影响因素,影响范围在7.5 km内;与二级公路的距离(DR_(Sec))是土壤Pb空间分布的关键影响因素,影响范围可达8 km;Fe_(2)O_(3)是土壤Cr空间分布的关键影响因素,土壤中氧化铁含量达到4.5%后开始正向影响土壤Cr含量.本研究定量解析了土壤重金属影响因素,可为土壤重金属污染防治提供科学决策依据. 展开更多
关键词 重金属 空间分布 CatBoost模型 shap解释方法 解释 影响因素
原文传递
多源数据驱动的轧机振动预测及可解释性分析
3
作者 张阳 段振杰 +3 位作者 王思静 林然锰 杜晓钟 王威中 《噪声与振动控制》 CSCD 北大核心 2024年第3期16-21,55,共7页
为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additiv... 为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additive exPlanations(SHAP)框架对预测模型进行解释。通过与其他预测模型相比,XGBoost预测模型可以利用工艺参数实现对轧机运行状态的高精度预测。基于SHAP框架解释的结果表明,出入口厚度、轧制力、轧制速度对轧机振动影响较大,后张力对轧机振动影响较小。研究为提高轧机设备与工艺参数的匹配度,实现将工业数据应用于轧机振动预测和分析提供理论基础。 展开更多
关键词 振动与波 轧机振动 工业数据 工艺参数 极端梯度提升 shap解释方法
下载PDF
公司债券信用利差微观影响因素研究——基于机器学习方法的分析
4
作者 江海潮 刘一达 《吉林工商学院学报》 2024年第1期85-92,共8页
基于2008—2022年我国A股上市公司发行的公司债券二级市场月度面板数据,使用多种机器学习方法研究债券个性因素与公司个性因素对公司债券信用利差的影响与贡献。研究结果表明,信用评级、月交易天数比例、公司产权性质、公司规模为公司... 基于2008—2022年我国A股上市公司发行的公司债券二级市场月度面板数据,使用多种机器学习方法研究债券个性因素与公司个性因素对公司债券信用利差的影响与贡献。研究结果表明,信用评级、月交易天数比例、公司产权性质、公司规模为公司债券信用利差的重要影响因素,企业资产负债率、债券剩余期限、控股股东股权质押比例、资产回报率、公司所属行业、第一大股东持股比例、公司股价波动和债券换手率为公司债券信用利差的次要影响因素;公司债券信用利差预测值与信用评级、公司规模、公司产权性质显著负相关,与债券月交易天数比例显著正相关;月交易天数比例、公司产权性质、公司规模对不同信用评级组别的影响存在异质性。债券月交易天数比例和公司产权性质对AA级及以下的低信用评级公司债券信用利差影响更大,发债公司规模对不同信用评级公司债券信用利差影响的差异性较小。 展开更多
关键词 公司债券 信用利差 shap解释方法 机器学习
下载PDF
机器学习驱动的辉光放电等离子体降解碱性紫16性能研究
5
作者 方野 王玉如 +3 位作者 曾静懿 王亚欣 郑伟 李敏睿 《中国环境科学》 EI CAS CSCD 北大核心 2024年第6期3206-3216,共11页
为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特... 为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特征提升(CatBoost)算法训练的模型性能最佳(R^(2)=0.988,MAE=2.050%).此外,沙普利加和解释方法(SHAP)对最佳模型的参数影响程度定量解析结果显示,反应时间(43.74%)、初始污染物浓度(23.00%)、氯化钾浓度(15.65%)和平均电流(12.63%)是影响BV16降解效率的关键因素.同时,基于部分依赖图(PDP)提出了参数交互影响优化方案.所建立的CatBoost-SHAP-PDP模型不仅能实现GDEP对BV16降解效果的模拟预测,而且是优化GDEP降解过程变量的有效方法,为GDEP降解染料废水复杂体系领域的建模与应用提供科学依据和技术支持. 展开更多
关键词 辉光放电等离子体 染料废水 shap解释方法 机器学习
下载PDF
通货膨胀影响因素识别——基于机器学习方法的再检验 被引量:8
6
作者 肖争艳 陈衎 +1 位作者 陈小亮 陈彦斌 《统计研究》 CSSCI 北大核心 2022年第6期132-147,共16页
准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统... 准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统方法的局限,本文综合使用SHAP值解释性方法和SVR等多种非线性机器学习方法,重新识别了2001—2019年间我国所发生的5轮通胀的影响因素。研究结果表明,第一,通胀预期和食品价格上涨是过去20多年间多轮通胀的共同驱动因素;第二,消费和投资等需求拉动因素对通胀的影响逐渐减弱,成本推动因素尤其是劳动力成本对通胀的影响不断增强;第三,货币政策能够通过多种渠道影响通胀走势,并且一直是通胀的重要影响因素。有鉴于此,建议通过加强引导通胀预期、稳定食品生产和供应、营造良好经营环境以缓解劳动成本上涨压力等举措防范通胀风险。此外,不能因为担心通胀压力就过于束缚货币政策的力度,应该在做好金融市场和房地产市场宏观审慎监管的前提下,适当加大货币政策对实体经济的支持力度,以更好地应对我国经济下行压力。 展开更多
关键词 通货膨胀 机器学习 shap解释方法 通胀预期
下载PDF
基于XGboost的企业债务违约特征预警分析 被引量:1
7
作者 谭本艳 袁神鹏 《会计之友》 北大核心 2023年第19期74-81,共8页
债务违约会对企业的正常生产经营带来严重的负面影响。文章以我国2012—2021年上市公司的财务数据和非财务数据共38个指标作为研究对象,首先查询企业的债务诉讼和信用债违约情况以确定企业是否债务违约,采用XGboost机器学习算法构建企... 债务违约会对企业的正常生产经营带来严重的负面影响。文章以我国2012—2021年上市公司的财务数据和非财务数据共38个指标作为研究对象,首先查询企业的债务诉讼和信用债违约情况以确定企业是否债务违约,采用XGboost机器学习算法构建企业债务违约风险预警模型,实证结果显示,基于XGboost所构建的企业债务违约风险预警模型具有较好的预警效果。其次,将XGboost训练模型与决策树、随机森林、Light GBM、GBDT、Adaboost等多种机器学习模型进行稳健性比较,结果表明,XGboost模型在AUC、准确率、精确率、召回率、F1值等各项性能指标上均优于对比模型。再次,分别引入SHAP映射图和SHAP力图对模型进行了全局性和局部性解释,发现影响企业债务违约风险的因素不仅仅局限于企业的财务状况,企业的股权结构、公司治理也是重要影响因素,对企业开展债务违约风险控制具有指导意义。最后,给企业提出了相关的建议。 展开更多
关键词 上市公司 债务违约 XGboost shap解释方法 机器学习
下载PDF
基于机器学习敏感性分析的RC板柱节点冲切角预测模型
8
作者 孙俊豪 沈袁协 梁诗雪 《科技通报》 2023年第10期52-57,97,共7页
为准确预测板柱节点冲切破坏倾角,本文收集了67组破坏倾角数据,建立基于机器学习的随机森林预测模型,并调整超参数使模型更加精确。通过RMSE(root mean square error)、MAE(mean absolute error)、R23个指标对预测结果进行检测,结果表... 为准确预测板柱节点冲切破坏倾角,本文收集了67组破坏倾角数据,建立基于机器学习的随机森林预测模型,并调整超参数使模型更加精确。通过RMSE(root mean square error)、MAE(mean absolute error)、R23个指标对预测结果进行检测,结果表明随机森林模型,在训练集和测试集上预测精度都较高。通过SHAP(Shapley Additive exPlanation)可解释方法,对随机森林预测模型的影响因素进行敏感性分析,发现混凝土抗压强度、钢筋屈服强度和钢筋配筋率对倾角的影响最大。选取上述3个影响因素进行拟合,得到RC板柱节点的冲切角计算公式,计算结果与实际值吻合良好。本文结果可为板柱结构性能研究提供参考。 展开更多
关键词 钢筋混凝土板 冲切破坏角 随机森林 shap解释方法 冲切角拟合公式
下载PDF
基于XGBoost的二轮车碾压事故致因研究
9
作者 殷豪 林淼 +2 位作者 王鹏 魏雯 朱彤 《安全与环境工程》 CAS CSCD 北大核心 2023年第5期19-27,45,共10页
二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMO... 二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMOTE)技术形成平衡数据集以训练机器学习模型;经过对比7种机器学习模型的分类性能,选用XGBoost模型构建二轮车碾压事故预测模型,并基于多项指标进行交叉验证以验证模型的预测性能;最后采用SHAP可解释性方法进一步挖掘二轮车碾压事故致因。结果表明:二轮车碾压事故致死率超出非碾压事故25.3%;XGBoost模型的综合预测性能优于其余6种机器学习模型;在与事故相关的环境因素中,工业区和郊区以及弯道、交叉路口是二轮车碾压事故的高发地点;与碰撞场景相关的二轮车碾压事故高风险因素包括二轮车侧面或尾部碰撞以及二轮车较低车速;摩托车以及踏板式二轮车不易被四轮机动车碾压;此外,二轮车车身越小,四轮机动车越高、越长,越容易发生二轮车碾压事故。根据研究结果从车辆设计、交通管理角度提出了避免二轮车骑行者遭受四轮机动车碾压的建议,为事故精准防控提供了新的视角和信息。 展开更多
关键词 二轮车 碾压事故 致因 机器学习 XGBoost模型 shap解释方法 交通安全
下载PDF
影响大学生学业成绩的多维因素探究——基于可解释的机器学习模型
10
作者 姜淑慧 江世银 张杰 《辽宁师范大学学报(社会科学版)》 2024年第4期97-105,共9页
在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对... 在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对较小。从基于GBDT模型的SHAP结果可以看出,大学生的性别、年龄、是否有额外工作、是否有伴侣、上课是否听讲对其学业成绩都具有显著的影响。学校应从疏导大学生克服失败焦虑、引导其树立正确的恋爱观、帮助其树立终身学习理念、关注其实践创新能力四个维度对大学生提前进行干预,有针对性地提升其学业成绩。 展开更多
关键词 学业成绩 机器学习 GBDT模型 shap解释方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部