期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于LightGBM和SHAP方法的居民投资风险偏好的实证分析
1
作者 祝起祾 苟小菊 《金融科技时代》 2024年第4期79-84,共6页
作为金融产品市场的重要客户群体,居民投资者的风险偏好在很大程度上决定了其对不同风险收益特征的金融产品的需求。文章利用LightGBM模型和SHAP方法对2017-2019年中国金融调查数据进行实证分析,基于高维特征充分挖掘居民风险偏好的影... 作为金融产品市场的重要客户群体,居民投资者的风险偏好在很大程度上决定了其对不同风险收益特征的金融产品的需求。文章利用LightGBM模型和SHAP方法对2017-2019年中国金融调查数据进行实证分析,基于高维特征充分挖掘居民风险偏好的影响因素及其影响机制。结果显示,年龄、金融素养、家庭收入和收入的跨期变动影响显著,其中年龄和金融素养的影响最为重要,年龄和居民投资风险偏好存在负向关系,而金融素养的提升会抬升风险偏好水平,收入对风险偏好的影响则较为复杂,存在非线性特征。 展开更多
关键词 机器学习 数据挖掘 LightGBM模型 风险偏好 shap方法
下载PDF
融合随机森林和SHAP方法的灌区用水调度经验分析--以淠史杭灌区瓦西干渠灌域为例 被引量:2
2
作者 苏楠 章少辉 +1 位作者 白美健 张宝忠 《灌溉排水学报》 CAS CSCD 北大核心 2022年第11期122-128,共7页
【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型... 【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型和SHAP方法,构建有限数据样本下灌区用水调度目标流量与各特征变量之间的非线性定量表征。【结果】应用该方法可得到长时间序列以及不同典型年情境下各特征变量的重要性得分及变化情况,在找到适用于实际用水调度特征变量组合的同时,可分析得到不同调度情景下主要参考的特征变量指标;结合SHAP值正负情况分析,还可得到用水调度目标流量对各特征变量响应的正负方向。【结论】本文所用方法实现了灌区用水调度历史经验的定量知识化表征,为理性预测未来不同用水调度流量提供科学依据。 展开更多
关键词 淠史杭灌区 用水调度 随机森林模型 shap方法 特征变量 非线性表征
下载PDF
基于多源数据和Stacking-SHAP方法的山地丘陵区土地覆被分类 被引量:1
3
作者 周亚男 陈绘 刘洪斌 《农业工程学报》 EI CAS CSCD 北大核心 2022年第23期213-222,共10页
山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数... 山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数字高程图中提取遥感、气候、土壤和地形四类特征变量,设计多种变量组合方案,结合Stacking算法,探讨不同类型变量在山区地物识别中的效用,并对比Stacking最佳方案与支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和极端梯度回归(eXtreme Gradient Boosting,XGBoost)算法的分类精度,评价Stacking方法在山区地物信息提取中的性能。同时,引入SHAP方法,量化Stacking模型中各特征变量的重要性。结果表明:在仅以遥感变量为基础方案时,山区土地覆被分类精度最低;在分别加入气候、土壤和地形变量后,总体精度、Kappa系数和F1分数均有所提高,其中旱地、水田和园地分类精度的提升幅度较大。基于Stacking算法结合所有类型特征变量的方案达到了最佳的分类精度,其总体精度、Kappa系数和F1分数分别为96.61%、0.96和94.81%,分类精度优于相同特征下的SVM、RF和XGBoost。SHAP方法可量化Stacking模型中特征变量的全局以及局部重要性,明确各变量对不同地物类型识别的相对贡献,为山区土地覆被分类的变量选择及优化提供有价值的信息。该研究可为机器学习协助复杂景观地区土地覆被制图研究提供技术支持和理论参考。 展开更多
关键词 遥感 多源数据 土地覆被分类 Stacking算法 shap方法 山地丘陵区
下载PDF
基于ANN和XGB算法的锈蚀钢筋混凝土高温粘结强度预测方法 被引量:1
4
作者 刘廷滨 黄滔 +3 位作者 欧嘉祥 李云霞 艾岩 任正熹 《工程力学》 EI CSCD 北大核心 2024年第S01期300-309,共10页
为准确评估锈蚀钢筋混凝土(CRC)结构在突发火灾下的结构承载力,锈蚀钢筋混凝土高温粘结强度的统一预测方法研究亟待开展。然而,粘结退化机理复杂,粘结因素众多,实验方法不能考虑所有粘结因素的相关复杂关系的影响。在现有大量试验数据... 为准确评估锈蚀钢筋混凝土(CRC)结构在突发火灾下的结构承载力,锈蚀钢筋混凝土高温粘结强度的统一预测方法研究亟待开展。然而,粘结退化机理复杂,粘结因素众多,实验方法不能考虑所有粘结因素的相关复杂关系的影响。在现有大量试验数据的基础上,采用机器学习方法可以有效地通过数据建立输入和输出特征之间的回归关系。该文利用ANN和XGB两种机器学习算法建立了一个统一的锈蚀钢筋混凝土高温粘结强度预测模型。基于612组高温锈蚀钢筋混凝土的试验研究数据,进行模型训练和测试。结果表明:ML模型的预测结果与实验结果十分吻合。此外,针对机器学习算法本身存在的黑盒子问题,使用SHAP方法来解决锈蚀钢筋混凝土高温粘结强度预测过程中的模型可解释性问题。同时,还将ML模型的计算结果与三种理论计算公式的结果进行了比较,结果表明:ML模型具有明显的优势。新构建的混合机器学习模型很有可能成为准确评估CRC结构经受高温后的损伤程度问题的新选择。 展开更多
关键词 人工神经网络(ANN) 极端梯度提升树(XGB) 锈蚀钢筋混凝土 高温粘结强度 shap方法
下载PDF
Shapley值及其应用 被引量:1
5
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 shapLEY值 权力指数 图博弈 shap方法
下载PDF
公司债券信用利差微观影响因素研究——基于机器学习方法的分析
6
作者 江海潮 刘一达 《吉林工商学院学报》 2024年第1期85-92,共8页
基于2008—2022年我国A股上市公司发行的公司债券二级市场月度面板数据,使用多种机器学习方法研究债券个性因素与公司个性因素对公司债券信用利差的影响与贡献。研究结果表明,信用评级、月交易天数比例、公司产权性质、公司规模为公司... 基于2008—2022年我国A股上市公司发行的公司债券二级市场月度面板数据,使用多种机器学习方法研究债券个性因素与公司个性因素对公司债券信用利差的影响与贡献。研究结果表明,信用评级、月交易天数比例、公司产权性质、公司规模为公司债券信用利差的重要影响因素,企业资产负债率、债券剩余期限、控股股东股权质押比例、资产回报率、公司所属行业、第一大股东持股比例、公司股价波动和债券换手率为公司债券信用利差的次要影响因素;公司债券信用利差预测值与信用评级、公司规模、公司产权性质显著负相关,与债券月交易天数比例显著正相关;月交易天数比例、公司产权性质、公司规模对不同信用评级组别的影响存在异质性。债券月交易天数比例和公司产权性质对AA级及以下的低信用评级公司债券信用利差影响更大,发债公司规模对不同信用评级公司债券信用利差影响的差异性较小。 展开更多
关键词 公司债券 信用利差 shap解释性方法 机器学习
下载PDF
基于可解释机器学习的水平井产能预测方法 被引量:16
7
作者 马先林 周德胜 +2 位作者 蔡文斌 李宪文 何明舫 《西南石油大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期81-90,共10页
准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密... 准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密气藏分段压裂水平井产能预测方法,该方法综合利用已收集的地质、压裂水平井产能及钻完井等多类型数据,通过机器学习算法直接挖掘数据内部规律,建立产能预测模型。此外,为解决常规机器学习模型的“黑盒子”问题,还利用SHAP(SHapley Additive exPlanations)方法对建立的机器学习模型进行全局和局部解释,分析影响产能的主要因素,增加了模型的可信性和透明度。以苏里格气田苏东示范区为例,验证了该方法的有效性和实用性。与油气藏数值方法相比,该方法不仅提高了产能预测的精度,而且缩短了建模周期,加快了计算速度。 展开更多
关键词 分段压裂水平井 机器学习 产能预测 可解释性 数据驱动 shap方法
下载PDF
通货膨胀影响因素识别——基于机器学习方法的再检验 被引量:10
8
作者 肖争艳 陈衎 +1 位作者 陈小亮 陈彦斌 《统计研究》 CSSCI 北大核心 2022年第6期132-147,共16页
准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统... 准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统方法的局限,本文综合使用SHAP值解释性方法和SVR等多种非线性机器学习方法,重新识别了2001—2019年间我国所发生的5轮通胀的影响因素。研究结果表明,第一,通胀预期和食品价格上涨是过去20多年间多轮通胀的共同驱动因素;第二,消费和投资等需求拉动因素对通胀的影响逐渐减弱,成本推动因素尤其是劳动力成本对通胀的影响不断增强;第三,货币政策能够通过多种渠道影响通胀走势,并且一直是通胀的重要影响因素。有鉴于此,建议通过加强引导通胀预期、稳定食品生产和供应、营造良好经营环境以缓解劳动成本上涨压力等举措防范通胀风险。此外,不能因为担心通胀压力就过于束缚货币政策的力度,应该在做好金融市场和房地产市场宏观审慎监管的前提下,适当加大货币政策对实体经济的支持力度,以更好地应对我国经济下行压力。 展开更多
关键词 通货膨胀 机器学习 shap值解释性方法 通胀预期
下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
9
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
下载PDF
奥运奖牌可以被预测吗?——基于可解释机器学习视角
10
作者 石慧敏 章东迎 章永辉 《上海体育大学学报》 CSSCI 北大核心 2024年第4期26-36,共11页
基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习... 基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习方法挖掘社会经济因素对奥运奖牌的影响发现:(1)对同一个项目而言,女子项目的可预测准确性普遍高于男子项目;(2)代表队所在地区的人口规模、人均GDP、是否为主办国等因素对奖牌总数具有一定影响;(3)在特定项目上,代表队的传统优势(如中国的乒乓球、美国的田径等)对奖牌预测具有较大影响。 展开更多
关键词 奥运奖牌 机器学习 特征重要性 shap方法 shapLEY值
下载PDF
混凝土抗压强度的可解释深度学习预测模型
11
作者 章伟琪 王辉明 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期738-744,752,共8页
为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习... 为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习模型挖掘各输入特征参数与抗压强度之间潜在的规律;通过可视化输入特征参数的SHAP值分析参数对抗压强度预测结果的重要性及影响规律.结果表明,所建深度学习模型相比其他传统模型具有更好的性能;SHAP分析结果与试验结果一致,该模型较好地反映了各特征参数之间复杂的非线性关系,可为混凝土材料的工程设计提供依据和参考. 展开更多
关键词 混凝土 抗压强度 深度学习 shap方法 可解释性
下载PDF
基于LightGBM-Informer的盾构隧道管片上浮长时间序列预测模型
12
作者 真嘉捷 赖丰文 +2 位作者 黄明 李爽 许凯 《岩土力学》 EI CAS CSCD 北大核心 2024年第12期3791-3801,共11页
基于机器学习预测施工期盾构刀盘前方管片上浮值,有助于及时调整盾构控制参数以缓解管片上浮病害。然而,已有模型在长时间序列预测问题上的性能不佳,难以精确预测盾构刀盘前方多环管片上浮值。通过考虑盾构控制、姿态参数及地层信息的影... 基于机器学习预测施工期盾构刀盘前方管片上浮值,有助于及时调整盾构控制参数以缓解管片上浮病害。然而,已有模型在长时间序列预测问题上的性能不佳,难以精确预测盾构刀盘前方多环管片上浮值。通过考虑盾构控制、姿态参数及地层信息的影响,结合Boruta算法,确定模型输入特征;利用小波变换滤波器、完备自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)方法消除时间序列数据噪声,构建了一种基于LightBGM-Informer的盾构隧道施工期管片上浮预测模型。通过南京和厦门地区某地铁盾构隧道监测数据,验证了所提模型的准确性和适用性。结果表明,所提模型预测精度较循环神经网络(recurrent neural network,RNN)、长短时记忆网络(long short-term memory,LSTM)、门控循环单元(gated recurrent unit,GRU)、Transformer等模型有所提升,且在地质条件不同的数据集上具有良好的泛化性;随着预测序列长度的增加,该模型的性能优势更突出,可准确预测盾构刀盘前方1~2环未施工管片的上浮值。基于沙普利加和解释(Shapley additive explanations,SHAP)方法的特征重要性分析指出,土舱压力及盾头、盾尾垂直位移对管片上浮影响显著。所提模型可为复杂环境下富水地层盾构隧道管片施工智能化控制提供理论指导。 展开更多
关键词 盾构隧道 管片上浮 长时间序列预测问题 Informer模型 shap方法
下载PDF
基于无人机图像和SHAP特征筛选的小麦田间产量预测方法研究
13
作者 朱志畅 葛焱 +4 位作者 臧晶荣 李庆 金时超 徐焕良 翟肇裕 《麦类作物学报》 2025年第2期264-274,共11页
为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间... 为了探寻适宜的小麦产量预测模型并提高其精度,从冬小麦灌浆期的无人机多光谱和RGB图像中提取了14种光谱参数和28种形态参数作为特征变量,利用线性回归、随机森林、神经网络等10种机器学习方法构建小麦田间产量预测模型,并比较了模型间预测能力的差异;同时,引入机器学习事后可解释性方法SHAP对输入的特征变量进行重要性分析和筛选,了解其提高模型预测能力的效果。结果表明:(1)10种机器学习模型中,误差逆传播神经网络BPNN的产量预测表现最好(r^(2)=0.826,RMSE=0.094 t·hm^(-2));(2)根据SHAP确定的特征变量重要性排序,花青素反射指数ARI和三维冠层体积Volume对于预测结果的影响最大,占全部特征重要性总和的45.48%;(3)经过SHAP特征筛选后,确定了在BPNN产量预测模型上表现最优的9个特征变量,其预测结果r^(2)为0.865,RMSE为0.075 t·hm^(-2),比使用全特征的BPNN和事前Pearson相关性分析方法在预测精度上均有提升。因此,在优选产量预测模型基础上,可采用SHAP机制对特征变量的重要性进行筛选和分析,以此进一步提高田间小麦产量预测精度。 展开更多
关键词 小麦 无人机图像 机器学习 shap加性解释方法 产量预测
下载PDF
可解释性验证的光伏出力实时纠偏概率预测模型
14
作者 蒋莹莹 田建艳 +2 位作者 姬政雄 菅垄 刘竖威 《高电压技术》 EI CAS CSCD 北大核心 2024年第9期3944-3954,I0013-I0015,共14页
为了解决目前光伏出力概率预测模型会随时间产生模型漂移且缺乏可解释性的问题,提出一种可解释性验证的光伏出力实时纠偏概率预测模型。首先在考虑季节的前提下构建了基于自然梯度提升(natural gradient boosting,NGBoost)的光伏出力概... 为了解决目前光伏出力概率预测模型会随时间产生模型漂移且缺乏可解释性的问题,提出一种可解释性验证的光伏出力实时纠偏概率预测模型。首先在考虑季节的前提下构建了基于自然梯度提升(natural gradient boosting,NGBoost)的光伏出力概率预测模型,通过超参数调优得到不同季节的光伏出力概率预测模型;其次通过分析光伏出力对象的时序特殊性,针对性地提出了一种简单有效的光伏出力概率预测实时纠偏策略,从而在考虑实时数据和历史数据的情况下对不确定性预测结果进行修正,使模型能够进行随时间演变的动态预测;然后结合沙普利加性(Shapley additive explanations,SHAP)方法挖掘主导因素对光伏出力不确定性的影响,旨在通过全局解释和局部解释探讨不同季节下各输入特征对光伏出力不确定性的贡献度,进一步验证所构建模型预测过程和修正策略的合理性;最后采用公开数据集进行仿真验证。研究结果表明:所提模型的连续概率排位分数处于9.89~24.01 kW之间,与其他模型相比精度较高,并且能够分析复杂预测过程,为光伏出力不确定性预测提供有效的理论支持。 展开更多
关键词 光伏出力 不确定性预测 NGBoost shap方法 可解释性 实时纠偏
下载PDF
小微企业违约特征再探索:基于SHAP解释方法的机器学习模型 被引量:1
15
作者 雷欣南 林乐凡 +1 位作者 肖斌卿 俞红海 《中国管理科学》 CSSCI CSCD 北大核心 2024年第5期1-12,共12页
机器学习方法已经被应用于小微企业贷款审批和监测过程,并且在违约识别方面取得了良好效果,但是机器学习系统决策过程的不可见性导致其在违约特征识别领域未能得到进一步实际应用。基于某银行的小微企业贷款微观数据,在机器学习模型基... 机器学习方法已经被应用于小微企业贷款审批和监测过程,并且在违约识别方面取得了良好效果,但是机器学习系统决策过程的不可见性导致其在违约特征识别领域未能得到进一步实际应用。基于某银行的小微企业贷款微观数据,在机器学习模型基础上加入SHAP(SHapley Additive exPlanations)解释方法对小微企业的违约特征进行研究比较,研究兼顾了实际情境中判别准确性和指标可解释的要求。研究发现,除传统的贷款信息与企业财务指标外,违约的核心特征中企业年龄、被告案件数量以及客户经理评价“软信息”等非财务指标对于识别小微企业违约具有重要价值。本文从可解释性的角度探讨机器学习方法在小微企业违约特征识别的应用,创新性地引入SHAP解释方法研究评级中的重要指标,同时所挖掘的关键指标对贷款业务开展具有指导意义。 展开更多
关键词 小微企业 违约特征 非财务信息 shap解释方法 机器学习
原文传递
多源数据驱动的轧机振动预测及可解释性分析 被引量:1
16
作者 张阳 段振杰 +3 位作者 王思静 林然锰 杜晓钟 王威中 《噪声与振动控制》 CSCD 北大核心 2024年第3期16-21,55,共7页
为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additiv... 为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additive exPlanations(SHAP)框架对预测模型进行解释。通过与其他预测模型相比,XGBoost预测模型可以利用工艺参数实现对轧机运行状态的高精度预测。基于SHAP框架解释的结果表明,出入口厚度、轧制力、轧制速度对轧机振动影响较大,后张力对轧机振动影响较小。研究为提高轧机设备与工艺参数的匹配度,实现将工业数据应用于轧机振动预测和分析提供理论基础。 展开更多
关键词 振动与波 轧机振动 工业数据 工艺参数 极端梯度提升 shap解释方法
下载PDF
影响大学生学业成绩的多维因素探究——基于可解释的机器学习模型
17
作者 姜淑慧 江世银 张杰 《辽宁师范大学学报(社会科学版)》 2024年第4期97-105,共9页
在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对... 在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对较小。从基于GBDT模型的SHAP结果可以看出,大学生的性别、年龄、是否有额外工作、是否有伴侣、上课是否听讲对其学业成绩都具有显著的影响。学校应从疏导大学生克服失败焦虑、引导其树立正确的恋爱观、帮助其树立终身学习理念、关注其实践创新能力四个维度对大学生提前进行干预,有针对性地提升其学业成绩。 展开更多
关键词 学业成绩 机器学习 GBDT模型 shap解释方法
下载PDF
机器学习驱动的辉光放电等离子体降解碱性紫16性能研究
18
作者 方野 王玉如 +3 位作者 曾静懿 王亚欣 郑伟 李敏睿 《中国环境科学》 EI CAS CSCD 北大核心 2024年第6期3206-3216,共11页
为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特... 为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特征提升(CatBoost)算法训练的模型性能最佳(R^(2)=0.988,MAE=2.050%).此外,沙普利加和解释方法(SHAP)对最佳模型的参数影响程度定量解析结果显示,反应时间(43.74%)、初始污染物浓度(23.00%)、氯化钾浓度(15.65%)和平均电流(12.63%)是影响BV16降解效率的关键因素.同时,基于部分依赖图(PDP)提出了参数交互影响优化方案.所建立的CatBoost-SHAP-PDP模型不仅能实现GDEP对BV16降解效果的模拟预测,而且是优化GDEP降解过程变量的有效方法,为GDEP降解染料废水复杂体系领域的建模与应用提供科学依据和技术支持. 展开更多
关键词 辉光放电等离子体 染料废水 shap解释方法 机器学习
下载PDF
基于LSTM-多头混合注意力的可解释换道意图预测
19
作者 高凯 刘健 +3 位作者 刘林鸿 刘欣宇 张金来 杜荣华 《汽车安全与节能学报》 CAS CSCD 北大核心 2024年第5期763-773,共11页
为了使自动驾驶汽车准确地预测其周围车辆的换道意图,提出了一种基于长短期记忆神经网络(LSTM)-多头混合注意力的可解释换道意图预测模型。该模型可以充分提取目标车辆与其周围车辆之间的时空交互关系,并且提出了一种基于最大熵的Shaple... 为了使自动驾驶汽车准确地预测其周围车辆的换道意图,提出了一种基于长短期记忆神经网络(LSTM)-多头混合注意力的可解释换道意图预测模型。该模型可以充分提取目标车辆与其周围车辆之间的时空交互关系,并且提出了一种基于最大熵的Shapley加性解释方法(SHAP)来解释各个特征在特定时间步对模型输出的影响程度,在HighD数据集上进行了实验。并通过SHAP值的可视化,直观解释了换道预测模型在特定时刻的目标车辆的换道行为。结果表明:该换道预测模型在换道前3 s的综合准确率,分别比LSTM、卷积神经网络(CNN)、多头注意力高出4.03%、9.51%、5.16%,这证明了模型在长时域预测的有效性;错误预测样本归因于模型缺陷或样本稀疏。该换道预测模型可为用户进行模型优化提供指导。 展开更多
关键词 自动驾驶汽车 换道意图预测 注意力机制 长短期记忆神经网络(LSTM) shapley加性解释方法(shap)
下载PDF
京津冀地区kNDVI时空变化及对气候因子的响应
20
作者 郭岚瑄 王贺封 +2 位作者 沈石凯 赵金山 魏凯濠 《西南农业学报》 CSCD 北大核心 2024年第8期1837-1849,共13页
【目的】探究京津冀地区植被动态变化对气候的响应机制,为更好地理解植被变化成因,为指导京津冀地区生态环境修复提供科学依据。【方法】利用趋势分析、偏相关分析、机器学习与可解释性方法,分析2000—2020年京津冀地区核归一化差异植... 【目的】探究京津冀地区植被动态变化对气候的响应机制,为更好地理解植被变化成因,为指导京津冀地区生态环境修复提供科学依据。【方法】利用趋势分析、偏相关分析、机器学习与可解释性方法,分析2000—2020年京津冀地区核归一化差异植被指数(kNDVI)的时空变化,探讨京津冀地区及不同用地类型kNDVI对降水和气温响应的差异性。【结果】京津冀地区kNDVI呈改善态势,增速为0.025/10 a,西北部改善较明显,林地明显改善面积最多,约占总面积17%;草地kNDVI的增速最快,为0.061/10 a;东南部城市周边退化明显,耕地kNDVI变化频繁,改善较多;京津冀大部分区域kNDVI与气温和降水的相关性均呈正相关,仅在南部城市周边表现为负相关;降水多年SHAP值为0.028,气温的多年SHAP值为0.016,均对京津冀地区kNDVI产生正面影响,总体上,降水对kNDVI的影响强于气温的影响。京津冀地区kNDVI对气候的响应存在区域差异,东南部平原区域的耕地kNDVI及西北部山区林地、草地kNDVI受降水的促进作用较明显,在城市周边和张家口等植被稀疏区域kNDVI受降水负面影响;气温对西北部林地与草地kNDVI的促进作用强于降水,气温对位于南部平原的耕地kNDVI有一定负面影响,而城乡、工矿、居民用地kNDVI受气温的负面影响最大。【结论】京津冀地区植被变化对降水的积极响应更强,不同土地利用类型kNDVI对气候因子响应具有区域空间差异。 展开更多
关键词 植被变化 kNDVI 气候因子 shap解释方法 京津冀
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部