摘要
进一步提升PM_(2.5)浓度预测精度的同时增强模型的可解释性,对深化大气污染防治,助推区域经济高质量发展有一定的现实意义。以空气污染物和气象条件作为特征因子,提出一种基于XGBoost与SHAP的PM_(2.5)浓度预测模型。首先,利用Lasoo对原始特征变量数据集进行处理,将处理完的数据作为XGBoost模型的输入进行迭代训练实验,以此获得性能最佳的预测模型。然后,使用SHAP对模型特征进行解释。结果表明,基于XGBoost的PM_(2.5)浓度预测模型在RMSE,MAE和R2三组指标上优于对比模型;综合SHAP、XGBoost和随机森林的特征变量重要性分布结果,识别影响PM_(2.5)浓度的关键因素。
作者
张士杰
窦燕
Zhang Shijie;Dou Yan
出处
《赤峰学院学报(自然科学版)》
2022年第12期10-17,共8页
Journal of Chifeng University(Natural Science Edition)
基金
国家自然科学基金地区项目(71563049)。