-
题名基于XGBoost算法的山东烟叶质量预测模型初探
被引量:5
- 1
-
-
作者
别瑞
周婷云
周显升
姜滨
周永
邱军
曹建敏
-
机构
中国农业科学院烟草研究所
中国农业科学院研究生院
香港大学理学院统计与精算系
山东中烟工业有限责任公司技术中心
中国烟草总公司山东省公司
山东日照烟草有限公司
-
出处
《中国烟草科学》
CSCD
北大核心
2022年第5期80-86,93,共8页
-
基金
中国农业科学院科技创新工程(ASTIP-TRIC06)
山东中烟工业有限责任公司重点项目(2021370000340022)。
-
文摘
为挖掘烟叶化学成分与感官质量之间的关系,探究机器学习算法在烟叶质量评价领域的应用效果,以山东烟叶为试验材料,开展了常规成分、生物碱、有机酸、多酚和单双糖等20项主要化学成分检测和感官质量评价,并根据感官质量优劣将其划分为好、中、差3个质量档次。利用遗传算法对XGBoost进行超参数寻优,建立了基于化学成分的山东烟叶质量档次预测模型,同时引入SHAP value模型解释框架进行全局解释与特征依赖分析。所建预测模型对山东烟叶质量档次判别准确率为85%,尤其对第3质量档次识别效果最佳。SHAP value全局解释表明,影响山东烤烟质量的7个特征指标贡献度排名为:酸酚比>蔗糖>氯>烟碱>降烟碱>柠檬酸>糖碱比,其中糖碱比、蔗糖、酸酚比分别为好、中、差质量档次判别贡献最大的化学指标。基于XGBoost算法的山东烟叶质量预测模型在烟叶质量档次判别应用中有效、可靠、可解释性强,对于烟叶质量评价和烟叶生产具有一定指导意义。
-
关键词
山东烟叶
XGBoost
机器学习
SHAP
value
质量预测
-
Keywords
Shandong tobacco
XGBoost
machine learning
SHAP value
quality prediction
-
分类号
TS411
[农业科学—烟草工业]
-