期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Shapley值及其应用
1
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 shapLEY值 权力指数 图博弈 shap方法
下载PDF
基于ANN和XGB算法的锈蚀钢筋混凝土高温粘结强度预测方法
2
作者 刘廷滨 黄滔 +3 位作者 欧嘉祥 李云霞 艾岩 任正熹 《工程力学》 EI CSCD 北大核心 2024年第S01期300-309,共10页
为准确评估锈蚀钢筋混凝土(CRC)结构在突发火灾下的结构承载力,锈蚀钢筋混凝土高温粘结强度的统一预测方法研究亟待开展。然而,粘结退化机理复杂,粘结因素众多,实验方法不能考虑所有粘结因素的相关复杂关系的影响。在现有大量试验数据... 为准确评估锈蚀钢筋混凝土(CRC)结构在突发火灾下的结构承载力,锈蚀钢筋混凝土高温粘结强度的统一预测方法研究亟待开展。然而,粘结退化机理复杂,粘结因素众多,实验方法不能考虑所有粘结因素的相关复杂关系的影响。在现有大量试验数据的基础上,采用机器学习方法可以有效地通过数据建立输入和输出特征之间的回归关系。该文利用ANN和XGB两种机器学习算法建立了一个统一的锈蚀钢筋混凝土高温粘结强度预测模型。基于612组高温锈蚀钢筋混凝土的试验研究数据,进行模型训练和测试。结果表明:ML模型的预测结果与实验结果十分吻合。此外,针对机器学习算法本身存在的黑盒子问题,使用SHAP方法来解决锈蚀钢筋混凝土高温粘结强度预测过程中的模型可解释性问题。同时,还将ML模型的计算结果与三种理论计算公式的结果进行了比较,结果表明:ML模型具有明显的优势。新构建的混合机器学习模型很有可能成为准确评估CRC结构经受高温后的损伤程度问题的新选择。 展开更多
关键词 人工神经网络(ANN) 极端梯度提升树(XGB) 锈蚀钢筋混凝土 高温粘结强度 shap方法
下载PDF
基于并行异构图和序列注意力机制的中文实体关系抽取模型
3
作者 毛典辉 李学博 +2 位作者 刘峻岭 张登辉 颜文婧 《计算机应用》 CSCD 北大核心 2024年第7期2018-2025,共8页
近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之... 近年来,随着深度学习技术的快速发展,实体关系抽取在许多领域取得了显著的进展。然而,由于汉语具有复杂的句法结构和语义关系,面向中文的实体关系抽取任务中仍然存在着多项挑战。其中,中文文本中的重叠三元组问题是领域中的重要难题之一。针对中文文本中的重叠三元组问题,提出了一种混合神经网络实体关系联合抽取(HNNERJE)模型。HNNERJE模型以并行方式融合序列注意力机制和异构图注意力机制,并结合门控融合策略构建了深度集成框架。该模型不仅可以同时捕获中文文本的语序信息和实体关联信息,还能够自适应地调整主客体标记器的输出,从而有效解决重叠三元组问题。另外,通过引入对抗训练算法提高模型对未见样本和噪声的适应能力。运用SHAP(SHapley Additive exPlanations)方法对HNNERJE模型进行解释分析,基于模型的识别结果解析它在抽取实体和关系时所依据的关键特征。HNNERJE模型在NYT、WebNLG、CMeIE和DuIE数据集上的F1值分别达到了92.17%、93.42%、47.40%和67.98%。实验结果表明:HNNERJE模型可以将非结构化的文本数据转化为结构化的知识表示,有效提取其中蕴含的有价值信息。 展开更多
关键词 实体关系抽取 异构图 注意力机制 对抗训练 shap方法
下载PDF
奥运奖牌可以被预测吗?——基于可解释机器学习视角
4
作者 石慧敏 章东迎 章永辉 《上海体育大学学报》 北大核心 2024年第4期26-36,共11页
基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习... 基于1992-2021年夏季奥运会的分项目成绩大数据,使用随机森林模型评估不同项目金牌和奖牌的可预测性,发现各项目存在较大的差异:对奖牌而言,可预测性最强的是乒乓球、羽毛球和游泳,而最弱的是水球、现代五项和排球。基于可解释机器学习方法挖掘社会经济因素对奥运奖牌的影响发现:(1)对同一个项目而言,女子项目的可预测准确性普遍高于男子项目;(2)代表队所在地区的人口规模、人均GDP、是否为主办国等因素对奖牌总数具有一定影响;(3)在特定项目上,代表队的传统优势(如中国的乒乓球、美国的田径等)对奖牌预测具有较大影响。 展开更多
关键词 奥运奖牌 机器学习 特征重要性 shap方法 shapLEY值
下载PDF
影响大学生学业成绩的多维因素探究——基于可解释的机器学习模型
5
作者 姜淑慧 江世银 张杰 《辽宁师范大学学报(社会科学版)》 2024年第4期97-105,共9页
在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对... 在机器学习模型基础上加入SHAP解释方法,对影响大学生学业成绩的潜在因素进行深入研究,兼顾实际情境中预测准确性和指标可解释的要求。研究结果表明,大学生的个人因素和学校教育因素对其学业成绩影响较大,家庭因素对其学业成绩影响相对较小。从基于GBDT模型的SHAP结果可以看出,大学生的性别、年龄、是否有额外工作、是否有伴侣、上课是否听讲对其学业成绩都具有显著的影响。学校应从疏导大学生克服失败焦虑、引导其树立正确的恋爱观、帮助其树立终身学习理念、关注其实践创新能力四个维度对大学生提前进行干预,有针对性地提升其学业成绩。 展开更多
关键词 学业成绩 机器学习 GBDT模型 shap解释方法
下载PDF
混凝土抗压强度的可解释深度学习预测模型
6
作者 章伟琪 王辉明 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期738-744,752,共8页
为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习... 为快速、准确地预测混凝土抗压强度,采用深度学习技术建立预测模型,使用贝叶斯优化算法进行模型自动优化调节,并结合SHapley Additive exPlanations(SHAP)可解释性方法对预测结果进行分析,以克服预测模型的“黑盒子”问题.利用深度学习模型挖掘各输入特征参数与抗压强度之间潜在的规律;通过可视化输入特征参数的SHAP值分析参数对抗压强度预测结果的重要性及影响规律.结果表明,所建深度学习模型相比其他传统模型具有更好的性能;SHAP分析结果与试验结果一致,该模型较好地反映了各特征参数之间复杂的非线性关系,可为混凝土材料的工程设计提供依据和参考. 展开更多
关键词 混凝土 抗压强度 深度学习 shap方法 可解释性
下载PDF
基于XGBoost算法的沥青路面横向裂缝预测模型
7
作者 丁壮 王长柏 肖伟 《河南城建学院学报》 CAS 2024年第4期39-46,共8页
横向裂缝是沥青路面的主要病害形式,其预测精度直接关系到路面结构设计的可靠性。为准确预测沥青路面在使用过程中横向裂缝的破坏情况,基于XGBoost算法构建了沥青路面横向裂缝预测模型。利用TPE-BO方法优化模型的超参数能提升模型性能... 横向裂缝是沥青路面的主要病害形式,其预测精度直接关系到路面结构设计的可靠性。为准确预测沥青路面在使用过程中横向裂缝的破坏情况,基于XGBoost算法构建了沥青路面横向裂缝预测模型。利用TPE-BO方法优化模型的超参数能提升模型性能。相较于RF和CatBoost模型,提出的模型预测精度更高。此外,通过相关性分析和SHAP方法对特征重要性进行评估,当模型输入变量数量减少4个时,模型效果达到最佳,降低了收集数据的成本和难度,对提高公路养护的经济性具有重要意义。 展开更多
关键词 XGBoost 横向裂缝预测 TPE-BO shap
下载PDF
机器学习驱动的辉光放电等离子体降解碱性紫16性能研究
8
作者 方野 王玉如 +3 位作者 曾静懿 王亚欣 郑伟 李敏睿 《中国环境科学》 EI CAS CSCD 北大核心 2024年第6期3206-3216,共11页
为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特... 为了量化研究辉光放电等离子体(GDEP)降解碱性紫16(BV16)的效率影响因素以进一步提升其降解性能,共收集462条降解实验数据建立数据集,训练并评价了9种回归模型.结果表明,基于梯度提升树(GBDT)的集成学习模型预测性能优异,且以类别型特征提升(CatBoost)算法训练的模型性能最佳(R^(2)=0.988,MAE=2.050%).此外,沙普利加和解释方法(SHAP)对最佳模型的参数影响程度定量解析结果显示,反应时间(43.74%)、初始污染物浓度(23.00%)、氯化钾浓度(15.65%)和平均电流(12.63%)是影响BV16降解效率的关键因素.同时,基于部分依赖图(PDP)提出了参数交互影响优化方案.所建立的CatBoost-SHAP-PDP模型不仅能实现GDEP对BV16降解效果的模拟预测,而且是优化GDEP降解过程变量的有效方法,为GDEP降解染料废水复杂体系领域的建模与应用提供科学依据和技术支持. 展开更多
关键词 辉光放电等离子体 染料废水 shap解释方法 机器学习
下载PDF
多源数据驱动的轧机振动预测及可解释性分析
9
作者 张阳 段振杰 +3 位作者 王思静 林然锰 杜晓钟 王威中 《噪声与振动控制》 CSCD 北大核心 2024年第3期16-21,55,共7页
为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additiv... 为研究轧制过程动态工艺参数对轧机振动的影响规律,改善现有研究中机理模型精度较低且数据模型缺乏可解释性的问题,采用极端梯度提升(Extreme Gradient Boosting,XGBoost)算法建立基于多源数据的轧机振动预测模型,并使用SHapley Additive exPlanations(SHAP)框架对预测模型进行解释。通过与其他预测模型相比,XGBoost预测模型可以利用工艺参数实现对轧机运行状态的高精度预测。基于SHAP框架解释的结果表明,出入口厚度、轧制力、轧制速度对轧机振动影响较大,后张力对轧机振动影响较小。研究为提高轧机设备与工艺参数的匹配度,实现将工业数据应用于轧机振动预测和分析提供理论基础。 展开更多
关键词 振动与波 轧机振动 工业数据 工艺参数 极端梯度提升 shap解释方法
下载PDF
基于改进SHAP的城市供水管网爆管主影响因素研究 被引量:4
10
作者 李超 陈功 +1 位作者 储文强 胡鸿昊 《科技通报》 2021年第1期79-84,共6页
城市供水管网爆管事件频发,基于爆管主影响因素的风险评估研究亟待深入开展。主影响因素识别是爆管风险评估准确性的重要基础,现有爆管风险评估模型研究缺乏对爆管主影响因素的分析,导致模型精度偏低。本文提出基于信息增益率权值的改进... 城市供水管网爆管事件频发,基于爆管主影响因素的风险评估研究亟待深入开展。主影响因素识别是爆管风险评估准确性的重要基础,现有爆管风险评估模型研究缺乏对爆管主影响因素的分析,导致模型精度偏低。本文提出基于信息增益率权值的改进SHAP法(SHapley Additive ex Planation),改善了多影响因素共同作用时各个特征的shapley值区分度较小、误差较大的问题。使得特征区分度较好、误差降低,有利于影响爆管的主影响因素更容易被自来水公司发觉。对爆管评估模型进行主影响因素分析结果表明,基于改进SHAP法获得的爆管主影响因素有利于提高供水管道爆管风险评估的准确率。 展开更多
关键词 供水管网 爆管风险 主影响因素分析 改进shap
下载PDF
可解释性验证的光伏出力实时纠偏概率预测模型
11
作者 蒋莹莹 田建艳 +2 位作者 姬政雄 菅垄 刘竖威 《高电压技术》 EI CAS CSCD 北大核心 2024年第9期3944-3954,I0013-I0015,共14页
为了解决目前光伏出力概率预测模型会随时间产生模型漂移且缺乏可解释性的问题,提出一种可解释性验证的光伏出力实时纠偏概率预测模型。首先在考虑季节的前提下构建了基于自然梯度提升(natural gradient boosting,NGBoost)的光伏出力概... 为了解决目前光伏出力概率预测模型会随时间产生模型漂移且缺乏可解释性的问题,提出一种可解释性验证的光伏出力实时纠偏概率预测模型。首先在考虑季节的前提下构建了基于自然梯度提升(natural gradient boosting,NGBoost)的光伏出力概率预测模型,通过超参数调优得到不同季节的光伏出力概率预测模型;其次通过分析光伏出力对象的时序特殊性,针对性地提出了一种简单有效的光伏出力概率预测实时纠偏策略,从而在考虑实时数据和历史数据的情况下对不确定性预测结果进行修正,使模型能够进行随时间演变的动态预测;然后结合沙普利加性(Shapley additive explanations,SHAP)方法挖掘主导因素对光伏出力不确定性的影响,旨在通过全局解释和局部解释探讨不同季节下各输入特征对光伏出力不确定性的贡献度,进一步验证所构建模型预测过程和修正策略的合理性;最后采用公开数据集进行仿真验证。研究结果表明:所提模型的连续概率排位分数处于9.89~24.01 kW之间,与其他模型相比精度较高,并且能够分析复杂预测过程,为光伏出力不确定性预测提供有效的理论支持。 展开更多
关键词 光伏出力 不确定性预测 NGBoost shap方法 可解释性 实时纠偏
下载PDF
A Real-time Prediction System for Molecular-level Information of Heavy Oil Based on Machine Learning
12
作者 Yuan Zhuang Wang Yuan +8 位作者 Zhang Zhibo Yuan Yibo Yang Zhe Xu Wei Lin Yang Yan Hao Zhou Xin Zhao Hui Yang Chaohe 《China Petroleum Processing & Petrochemical Technology》 SCIE CAS CSCD 2024年第2期121-134,共14页
Acquiring accurate molecular-level information about petroleum is crucial for refining and chemical enterprises to implement the“selection of the optimal processing route”strategy.With the development of data predic... Acquiring accurate molecular-level information about petroleum is crucial for refining and chemical enterprises to implement the“selection of the optimal processing route”strategy.With the development of data prediction systems represented by machine learning,it has become possible for real-time prediction systems of petroleum fraction molecular information to replace analyses such as gas chromatography and mass spectrometry.However,the biggest difficulty lies in acquiring the data required for training the neural network.To address these issues,this work proposes an innovative method that utilizes the Aspen HYSYS and full two-dimensional gas chromatography-time-of-flight mass spectrometry to establish a comprehensive training database.Subsequently,a deep neural network prediction model is developed for heavy distillate oil to predict its composition in terms of molecular structure.After training,the model accurately predicts the molecular composition of catalytically cracked raw oil in a refinery.The validation and test sets exhibit R2 values of 0.99769 and 0.99807,respectively,and the average relative error of molecular composition prediction for raw materials of the catalytic cracking unit is less than 7%.Finally,the SHAP(SHapley Additive ExPlanation)interpretation method is used to disclose the relationship among different variables by performing global and local weight comparisons and correlation analyses. 展开更多
关键词 heavy distillate oil molecular composition deep learning shap interpretation method
下载PDF
京津冀地区kNDVI时空变化及对气候因子的响应
13
作者 郭岚瑄 王贺封 +2 位作者 沈石凯 赵金山 魏凯濠 《西南农业学报》 CSCD 北大核心 2024年第8期1837-1849,共13页
【目的】探究京津冀地区植被动态变化对气候的响应机制,为更好地理解植被变化成因,为指导京津冀地区生态环境修复提供科学依据。【方法】利用趋势分析、偏相关分析、机器学习与可解释性方法,分析2000—2020年京津冀地区核归一化差异植... 【目的】探究京津冀地区植被动态变化对气候的响应机制,为更好地理解植被变化成因,为指导京津冀地区生态环境修复提供科学依据。【方法】利用趋势分析、偏相关分析、机器学习与可解释性方法,分析2000—2020年京津冀地区核归一化差异植被指数(kNDVI)的时空变化,探讨京津冀地区及不同用地类型kNDVI对降水和气温响应的差异性。【结果】京津冀地区kNDVI呈改善态势,增速为0.025/10 a,西北部改善较明显,林地明显改善面积最多,约占总面积17%;草地kNDVI的增速最快,为0.061/10 a;东南部城市周边退化明显,耕地kNDVI变化频繁,改善较多;京津冀大部分区域kNDVI与气温和降水的相关性均呈正相关,仅在南部城市周边表现为负相关;降水多年SHAP值为0.028,气温的多年SHAP值为0.016,均对京津冀地区kNDVI产生正面影响,总体上,降水对kNDVI的影响强于气温的影响。京津冀地区kNDVI对气候的响应存在区域差异,东南部平原区域的耕地kNDVI及西北部山区林地、草地kNDVI受降水的促进作用较明显,在城市周边和张家口等植被稀疏区域kNDVI受降水负面影响;气温对西北部林地与草地kNDVI的促进作用强于降水,气温对位于南部平原的耕地kNDVI有一定负面影响,而城乡、工矿、居民用地kNDVI受气温的负面影响最大。【结论】京津冀地区植被变化对降水的积极响应更强,不同土地利用类型kNDVI对气候因子响应具有区域空间差异。 展开更多
关键词 植被变化 kNDVI 气候因子 shap解释方法 京津冀
下载PDF
基于集成学习的蔗渣灰混凝土抗压强度预测模型
14
作者 林星 梁诗雪 冯斯奕 《浙江理工大学学报(自然科学版)》 2024年第4期507-517,共11页
为了得到高效准确的基于集成学习的蔗渣灰混凝土抗压强度预测模型,建立了4种集成学习模型,即eXtreme Gradient-Boosting(XGBoost)、Random Forest(RF)、Light Gradient-Boosting Machine(LightGBM)和Adaptive Boosting(AdaBoost);通过... 为了得到高效准确的基于集成学习的蔗渣灰混凝土抗压强度预测模型,建立了4种集成学习模型,即eXtreme Gradient-Boosting(XGBoost)、Random Forest(RF)、Light Gradient-Boosting Machine(LightGBM)和Adaptive Boosting(AdaBoost);通过模型的性能比较得到了预测能力最优的集成学习模型,然后利用SHAP(Shapley additive explanation)值方法定量研究各输入变量对蔗渣灰混凝土抗压强度的影响。首先,进行蔗渣灰混凝土抗压强度试验,根据试验数据和文献数据构建了包含水泥含量、水灰比、蔗渣灰掺和量、细骨料含量、粗骨料含量等5个输入变量的集成学习数据库。然后,采用决定系数、平均绝对误差、均方根误差、可靠性指数等4个评估指标来评估模型的预测能力。通过对比发现:XGBoost模型的预测精度最高,该模型训练集的评估指标决定系数、平均绝对误差、均方根误差、可靠性指数分别为0.976、1.811、2.344、0.875。各输入变量对蔗渣灰混凝土抗压强度的影响从大到小排序为水泥含量、细骨料含量、粗骨料含量、蔗渣灰掺和量、水灰比;水泥含量对混凝土抗压强度有正面影响,蔗渣灰掺和量低于10%时不会明显降低混凝土的抗压强度。该研究为蔗渣灰混凝土抗压强度的预测和影响因素解释提供了有益参考,对于推动蔗渣灰混凝土等环保型材料的研究和应用具有一定价值。 展开更多
关键词 集成学习 蔗渣灰混凝土 抗压强度 shap值方法 预测模型
下载PDF
融合随机森林和SHAP方法的灌区用水调度经验分析--以淠史杭灌区瓦西干渠灌域为例 被引量:1
15
作者 苏楠 章少辉 +1 位作者 白美健 张宝忠 《灌溉排水学报》 CAS CSCD 北大核心 2022年第11期122-128,共7页
【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型... 【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型和SHAP方法,构建有限数据样本下灌区用水调度目标流量与各特征变量之间的非线性定量表征。【结果】应用该方法可得到长时间序列以及不同典型年情境下各特征变量的重要性得分及变化情况,在找到适用于实际用水调度特征变量组合的同时,可分析得到不同调度情景下主要参考的特征变量指标;结合SHAP值正负情况分析,还可得到用水调度目标流量对各特征变量响应的正负方向。【结论】本文所用方法实现了灌区用水调度历史经验的定量知识化表征,为理性预测未来不同用水调度流量提供科学依据。 展开更多
关键词 淠史杭灌区 用水调度 随机森林模型 shap方法 特征变量 非线性表征
下载PDF
基于改进Stacking集成学习的高强度钢柱屈曲能力预测 被引量:1
16
作者 何智成 韩茳 +1 位作者 宋贤海 张桂勇 《计算力学学报》 CAS CSCD 北大核心 2023年第4期585-593,共9页
由于屈曲强度的形成机制复杂,影响屈曲强度的因素较多,目前对屈曲强度的认识还不全面。近年来,机器学习已初步应用于预测结构屈曲强度等力学性能,然而基于实验测试的样本数据量小容易造成过拟合,导致其预测精度低。本文提出一种基于改进... 由于屈曲强度的形成机制复杂,影响屈曲强度的因素较多,目前对屈曲强度的认识还不全面。近年来,机器学习已初步应用于预测结构屈曲强度等力学性能,然而基于实验测试的样本数据量小容易造成过拟合,导致其预测精度低。本文提出一种基于改进Stacking算法的GSSA(Grid Search-Stacking Algorithm)模型,并对某型号高强度钢柱屈曲强度进行预测,提升了屈曲强度的预测精度。首先,基于标准Stacking算法通过使用网格搜索算法选择最优基模型组合,并采用留一交叉验证(LOOCV)法训练基模型,实现了GSSA模型的构建,有效解决了小样本集训练带来的预测精度低问题;然后,为了进一步验证GSSA模型的可靠性,本文采用Bland-Altman法对GSSA模型进行一致性评价,结果表明,GSSA模型具有很好的可靠性;最后,采用SHAP模型对GSSA模型预测的屈曲强度进行了可解释性分析,实现了其影响因素评价。 展开更多
关键词 屈曲强度 Stacking算法 GSSA模型 Bland-Altman法 shap模型
下载PDF
灌区用水调度的知识图谱模型构建——以淠史杭灌区瓦西干渠灌域为例 被引量:1
17
作者 苏楠 章少辉 +1 位作者 白美健 张宝忠 《灌溉排水学报》 CAS CSCD 北大核心 2023年第11期112-120,共9页
【目的】人工智能技术以全新的自适应学习视角为灌区智慧化建设带来了异于传统的研究范式,迄今已有众多智能算法与技术应用于灌区用水调度决策研究中,但已有成果缺乏便利性和易操作性,无法真正落地。【方法】为此,本文通过对比分析人工... 【目的】人工智能技术以全新的自适应学习视角为灌区智慧化建设带来了异于传统的研究范式,迄今已有众多智能算法与技术应用于灌区用水调度决策研究中,但已有成果缺乏便利性和易操作性,无法真正落地。【方法】为此,本文通过对比分析人工智能技术中的随机森林和BP神经网络模型,发现融合SHAP(Shapley additive explanation,SHAP)方法的随机森林模型具有更优的灌区用水调度预测效果。在此基础上,基于历史实测数据将灌区用水调度变量划分为不同梯度,表征出9.82×10^(11)组用水调度场景样本,并采用预先训练的随机森林模型获得了各样本对应的调度流量预测值,由此形成了灌区用水调度场景与调度流量值之间映射关系的基础数据库,即在现有调度历史数据的基础上利用机器学习模型丰富和加密了调度场景,得到了能实现基本覆盖现实调度场景的调度场景库。基于该场景数据库,利用Neo4j图形库构建出淠史杭灌区用水调度流量预测值知识图谱模型。【结果】利用该图谱模型,灌区用水调度管理人员仅需确认目标调度场景中各调度变量在知识图谱模型中的近似梯度值,即可检索获得调度流量预测值。【结论】经应用验证表明,由该知识图谱模型获得的调度流量预测值误差在淠史杭灌区用水管理人员的经验认知范围内,且可实现调度流量值的实时检索。 展开更多
关键词 淠史杭灌区 用水调度 机器学习 shap方法 知识图谱
下载PDF
基于XGBoost的二轮车碾压事故致因研究 被引量:1
18
作者 殷豪 林淼 +2 位作者 王鹏 魏雯 朱彤 《安全与环境工程》 CAS CSCD 北大核心 2023年第5期19-27,45,共10页
二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMO... 二轮车被卷入机动车底部并遭受碾压,会造成严重的事故伤害。为识别二轮车被卷入机动车底部的原因及其影响因素,以中国交通事故深度调查(CIDAS)数据库中2 627起二轮车与机动车碰撞事故案例为基础,根据数据分布特征采用合成少数过采样(SMOTE)技术形成平衡数据集以训练机器学习模型;经过对比7种机器学习模型的分类性能,选用XGBoost模型构建二轮车碾压事故预测模型,并基于多项指标进行交叉验证以验证模型的预测性能;最后采用SHAP可解释性方法进一步挖掘二轮车碾压事故致因。结果表明:二轮车碾压事故致死率超出非碾压事故25.3%;XGBoost模型的综合预测性能优于其余6种机器学习模型;在与事故相关的环境因素中,工业区和郊区以及弯道、交叉路口是二轮车碾压事故的高发地点;与碰撞场景相关的二轮车碾压事故高风险因素包括二轮车侧面或尾部碰撞以及二轮车较低车速;摩托车以及踏板式二轮车不易被四轮机动车碾压;此外,二轮车车身越小,四轮机动车越高、越长,越容易发生二轮车碾压事故。根据研究结果从车辆设计、交通管理角度提出了避免二轮车骑行者遭受四轮机动车碾压的建议,为事故精准防控提供了新的视角和信息。 展开更多
关键词 二轮车 碾压事故 致因 机器学习 XGBoost模型 shap可解释性方法 交通安全
下载PDF
基于连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演 被引量:2
19
作者 叶淼 朱琳 +3 位作者 刘旭东 黄勇 陈蓓蓓 李欢 《环境科学》 EI CAS CSCD 北大核心 2024年第4期2280-2291,共12页
针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土... 针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土壤光谱反射率数据构建初始XGBoost模型;然后,利用SHAP方法分析模型中各波段的贡献度以筛选特征波段;最后,基于特征波段重新构建和优化XGBoost模型,实现土壤有机质含量高光谱反演.发现连续小波变换尺度为25时,利用SHAP方法选取的40个特征波段构建的XGBoost模型准确性最高,有机质含量反演值和实测值之间的R~2为0.80,RMSE为3.60g·kg^(-1);随着连续小波变换尺度的增大,R2呈现先升高后降低的趋势,25尺度下的R2比21尺度的高0.37;SHAP方法选取的特征波段比Pearson相关分析法少682个,RMSE低0.69 g·kg^(-1);XGBoost模型的R2分别比随机森林和支持向量机模型高4%和8%.验证了结合连续小波变换、SHAP和XGBoost在土壤有机质含量高光谱反演中的有效性,为快速、准确监测土壤有机质含量提供技术支撑. 展开更多
关键词 土壤有机质(SOM) 高光谱反演 连续小波变换 shap方法 XGBoost模型
原文传递
通货膨胀影响因素识别——基于机器学习方法的再检验 被引量:10
20
作者 肖争艳 陈衎 +1 位作者 陈小亮 陈彦斌 《统计研究》 CSSCI 北大核心 2022年第6期132-147,共16页
准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统... 准确识别通货膨胀的影响因素,可以前瞻性地防范通胀风险及其危害,具有重要政策意义。已有研究主要使用SVAR等传统计量方法分析通胀的影响因素,但传统计量方法能够涵盖的因素种类和非线性关系有限。考虑到机器学习方法能够有效突破传统方法的局限,本文综合使用SHAP值解释性方法和SVR等多种非线性机器学习方法,重新识别了2001—2019年间我国所发生的5轮通胀的影响因素。研究结果表明,第一,通胀预期和食品价格上涨是过去20多年间多轮通胀的共同驱动因素;第二,消费和投资等需求拉动因素对通胀的影响逐渐减弱,成本推动因素尤其是劳动力成本对通胀的影响不断增强;第三,货币政策能够通过多种渠道影响通胀走势,并且一直是通胀的重要影响因素。有鉴于此,建议通过加强引导通胀预期、稳定食品生产和供应、营造良好经营环境以缓解劳动成本上涨压力等举措防范通胀风险。此外,不能因为担心通胀压力就过于束缚货币政策的力度,应该在做好金融市场和房地产市场宏观审慎监管的前提下,适当加大货币政策对实体经济的支持力度,以更好地应对我国经济下行压力。 展开更多
关键词 通货膨胀 机器学习 shap值解释性方法 通胀预期
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部